구글 딥마인드, 추론 성능 높인 Gemini 3.1 Pro 공개
- •구글 딥마인드가 복잡한 문제 해결을 위해 논리 추론 능력을 강화한 Gemini 3.1 Pro를 출시했다.
- •이 모델은 ARC-AGI-2 벤치마크에서 77.1%를 기록하며 이전 모델 대비 2배 이상의 성능 향상을 보였다.
- •코드 기반의 SVG 애니메이션 생성 및 실시간 시스템 합성 등 혁신적인 기능을 새롭게 선보였다.
구글 딥마인드가 단순한 답변을 넘어 고차원적인 과업을 수행할 수 있도록 설계된 대규모 업데이트 모델인 Gemini 3.1 Pro를 전격 공개했다. 지난주 업데이트가 전문적인 과학 분야의 성과에 집중했다면, 이번 3.1 Pro는 그러한 고급 논리력을 일상적인 애플리케이션에 접목했다는 점에서 차별화된다. 현재 이 모델은 Gemini API와 Google AI Studio는 물론 NotebookLM과 같은 사용자 앱에도 순차적으로 적용되고 있으며, 복잡한 난제를 해결하기 위한 더욱 똑똑한 기준점을 제시하고 있다.
이번 모델에서 가장 주목할 부분은 ARC-AGI-2 벤치마크 성적이다. 이 테스트는 단순히 데이터를 암기하는 능력을 넘어, 훈련 과정에서 접하지 못한 완전히 새로운 논리 패턴을 해결하는 추론 능력을 측정하는 방식이다. Gemini 3.1 Pro는 여기서 77.1%라는 검증된 점수를 기록했다. 특히 이는 이전 버전인 3 Pro와 비교해 2배가 넘는 수치로, 추상적인 문제 해결 능력에 있어 비약적인 도약을 이뤄냈음을 입증한다.
강화된 지능은 실제 활용 분야에서도 돋보인다. 이 모델은 코드로 구축되어 크기 조절이 자유로운 그래픽인 SVG 기반 애니메이션을 직접 생성하거나, 국제 우주 정거장(ISS)의 궤도 시각화와 같은 복잡한 데이터를 실시간 대시보드로 합성해낼 수 있다. 또한 소설 '폭풍의 언덕'의 문학적 테마를 분석해 그에 어울리는 기능적이고 심미적인 사용자 인터페이스(UI)로 구현하는 등 창의적인 코딩 능력까지 선보였다.
개발자들을 위한 환경도 개선되었다. 구글은 Google AI Pro 및 Ultra 구독자를 대상으로 API 사용 한도를 상향 조정했다. 이번 프리뷰 단계의 목적은 AI가 복잡한 프로세스를 자율적으로 관리하는 멀티스텝 에이전트 워크플로우에서의 성능을 최적화하는 데 있다. 이에 따라 구글 딥마인드는 성능 고도화를 거쳐 올해 말 정식 출시를 통해 서비스 범위를 더욱 확대할 계획이다.