이 기사의 핵심 내용은?

Google DeepMind가 텍스트로 720p 상호작용 환경을 생성하는 범용 월드 모델 Genie 3를 발표했다. 초당 24프레임의 속도로 복잡한 물리 법칙과 생태계를 시뮬레이션하며 장시간 일관성을 유지한다. 시뮬레이션 환경을 통해 AI 에이전트를 학습시키며 범용 인공지능 (AGI) 개발의 핵심 토대를 구축한다.

Google DeepMind, 상호작용하는 가상 세계 'Genie 3' 공개

•Google DeepMind가 텍스트로 720p 상호작용 환경을 생성하는 범용 월드 모델 Genie 3를 발표했다.
•초당 24프레임의 속도로 복잡한 물리 법칙과 생태계를 시뮬레이션하며 장시간 일관성을 유지한다.
•시뮬레이션 환경을 통해 AI 에이전트를 학습시키며 범용 인공지능 (AGI) 개발의 핵심 토대를 구축한다.

Google DeepMind가 최근 월드 모델의 중대한 도약을 알리는 Genie 3를 공개했다. 월드 모델은 물리적 환경을 시뮬레이션하고 특정 행동이 환경을 어떻게 변화시키는지 예측하도록 설계된 AI 시스템이다. 이전 버전과 달리 Genie 3는 고화질의 상호작용 세계를 초당 24프레임이라는 매끄러운 속도로 생성한다. 사용자는 720p 해상도의 환경 속에서 수 분간 머물 수 있으며, 모델은 수면에 반사되는 빛이나 지면의 질감 같은 세밀한 물리적 일관성을 놓치지 않는다. 단순히 화려한 그래픽을 보여주는 수준을 넘어섰다. 이 모델의 진정한 가치는 범용 인공지능 (AGI) 개발을 위한 파운데이션 모델로서의 역할에 있다. 연구진은 Genie 3가 생성한 무한하고 다양한 시뮬레이션 속에서 AI 에이전트에게 고도의 커리큘럼 학습을 시킨다. 현실 세계의 위험이나 막대한 비용 없이도 복잡한 과제를 마스터할 수 있는 체계적인 학습 경로가 열린 셈이다. 이는 예측 불가능한 자연 현상에 대응해야 하는 로봇공학과 자율 시스템 발전에 필수적인 기술이다. Genie 3는 직관적인 물리 법칙을 놀라울 정도로 정확하게 파악하고 있다. 강풍에 휘어지는 야자수부터 심해 해파리의 신비로운 발광까지 생생하게 구현해 낸다. Genie 2가 가능성을 보여주었다면, Genie 3는 실시간 상호작용에 초점을 맞춰 인간이나 AI 에이전트가 생성된 세계를 게임처럼 직접 '플레이'할 수 있게 한다. AI가 인간과 같은 깊이로 물리 세계를 시각화하고 추론하는 시대가 성큼 다가왔다는 평가다.