평균의 함정: MIT, AI 성능 측정의 위험성 경고 | aib vote