AGI의 시대: DeepMind가 제안하는 10가지 인지 능력 평가
- •구글 DeepMind가 범용 인공지능(AGI)의 발전 단계를 측정하기 위해 10가지 인지 능력 기반의 평가 체계를 제안했다.
- •단일 점수 체계에서 벗어나 인지 과학을 기반으로 AI의 강점과 약점을 다각도로 분석하는 프로파일링 방식을 도입했다.
- •평가 방법론 구축을 위해 캐글(Kaggle) 해커톤을 개최하고 총 20만 달러의 상금을 내걸었다.
인공지능 연구 현장에서는 그동안 우리가 범용 인공지능(AGI)에 얼마나 근접했는지에 대한 논의가 다소 추상적인 수준에 머물러 있었다. 지금까지 AI 성능은 특정 과제에서 거둔 점수를 바탕으로 측정되었으나, 이러한 방식은 AI가 가진 지능의 전체적인 면모를 파악하기에 지나치게 제한적이었다. 이를 개선하기 위해 구글 DeepMind는 AI 지능을 10가지 인지 능력으로 세분화하여 실증적으로 측정하는 야심 찬 프레임워크를 발표했다.
제안된 10가지 항목은 지각, 생성, 주의, 학습, 기억, 추론, 메타인지, 실행 기능, 문제 해결, 그리고 사회적 인지이다. 단순히 계산 능력이나 방대한 지식량을 측정하는 것을 넘어 인간의 고유한 지적 특성인 자기 객관화와 문맥 적응력을 평가 범위에 포함했다는 점이 핵심이다. 메타인지는 자신의 사고 과정을 스스로 통제하는 능력을 의미하며, 사회적 인지는 타인의 의도나 상황적 맥락을 파악하는 능력을 뜻한다.
이번 평가 방식은 AI 시스템을 일렬로 줄 세우는 대신 각각의 고유한 인지 프로파일을 작성하는 데 중점을 둔다. 연구자들은 이 방식을 통해 특정 모델이 어떤 분야에서 인간의 수준에 도달했고, 또 어떤 부분에서 격차를 보이는지 시각적이고 논리적으로 확인할 수 있다. 과제 수행, 인간 기준 데이터 수집, 그리고 인간과의 성능 비교라는 3단계 평가 프로토콜을 통해 AGI에 도달하는 과정을 이분법적인 수치가 아닌 연속적인 스펙트럼으로 정량화하게 되었다.
구글 DeepMind는 이 프레임워크를 단순한 연구 제안에 그치지 않기 위해 캐글을 통해 해커톤을 진행하고 있다. 평가 방법론을 정립하는 것은 모델을 개발하는 일만큼이나 까다로운 도전이다. 특히 사회적 인지나 실행 기능처럼 추상적인 영역을 어떤 방식으로 객관적인 지표로 치환할지는 커뮤니티 전체가 해결해야 할 당면 과제이다. 20만 달러에 달하는 상금을 통해 평가 체계의 표준화를 앞당기려는 구글의 전략적 의도가 엿보인다.
학생 여러분이 주목해야 할 점은 이번 뉴스가 단순한 성능 지표의 갱신이 아니라는 사실이다. AI 개발이 이제 막연한 고성능 추구를 넘어 지능을 객관적으로 이해하고 과학적으로 측정하는 단계로 접어들고 있다. AGI라는 모호한 개념을 명확하게 정의하고 부족한 역량을 식별하는 과정은, 향후 AI의 안전성과 거버넌스를 구축할 때 가장 중요한 나침반이 될 것이다. 이번 연구는 우리가 AI라는 미지의 존재를 이해하고 제어 가능한 사회적 자산으로 통합해 나가는 결정적인 이정표가 될 것으로 보인다.