스탠포드대, AI 공간 인지 능력 측정하는 '공간 이론' 공개
- •스탠포드 연구진이 AI의 내부 심적 지도 구축 능력을 테스트하기 위한 '공간 이론(Theory of Space)'을 도입했다.
- •GPT-5.2와 같은 최신 모델들도 능동적 탐색이 필요한 환경에서는 성능이 크게 하락하는 것으로 나타났다.
- •이번 연구는 AI가 물체 이동 시 지도를 갱신하지 못하는 '신념 관성(Belief Inertia)' 현상을 주요 결함으로 지적했다.
스탠포드 대학교(Stanford University) 연구진은 인공지능이 물리적 환경에 대한 심적 지도를 생성하고 유지할 수 있는지 평가하는 새로운 벤치마크인 '공간 이론(Theory of Space)'을 발표했다. 인지 과학 개념인 '마음 이론(Theory of Mind)'에서 영감을 얻은 이 프레임워크는 수동적 관찰에서 벗어나 능동적 탐색으로 초점을 전환한 것이 특징이다. 이에 따라 AI 에이전트는 단순히 정적인 이미지 로그를 처리하는 대신, 주변 환경을 이해하기 위해 어디로 이동하고 무엇을 관찰할지 스스로 결정해야 한다.
이번 연구는 GPT-5.2와 Gemini 3 Pro를 포함한 주요 모델을 대상으로 공간적 신념 구축, 신념을 활용한 과제 해결, 환경 변화에 따른 신념 수정이라는 세 가지 핵심 차원을 테스트했다. 분석 결과, 시각적 데이터보다 텍스트 기반 설명을 제공받았을 때 모델의 성능이 훨씬 뛰어난 '모달리티 격차'가 뚜렷하게 확인됐다. 특히 최첨단 시스템조차 물체의 위치가 바뀌었음에도 과거의 공간 정보에 집착하는 '신념 관성(Belief Inertia)' 문제로 인해 지도 갱신에 어려움을 겪는 모습이 관찰됐다.
스탠포드 대학교 교수이자 인공지능 분야의 권위자인 리 페이페이(Li Fei-Fei) 등이 참여한 이번 연구 결과는 현재의 파운데이션 모델이 데이터 처리에는 능숙하지만, 실세계 로보틱스에 필요한 효율성과 안정성은 부족하다는 점을 시사한다. 실제로 현재의 에이전트들은 방 지도를 작성할 때 사람이 설계한 버전보다 훨씬 더 많은 단계를 거치며, 특정 구역을 미처 다 탐색하지 못하는 경우가 빈번하다. 결과적으로 공간 이론 벤치마크는 내부적인 인지 지도를 외현화함으로써, AI가 자신이 속한 3차원 세계를 진정으로 이해할 수 있도록 돕는 명확한 이정표를 제시하고 있다.