이 기사의 핵심 내용은?

DeepSeek-V3.2 정식 출시, 추론 벤치마크에서 GPT-5급 성능 달성 사고 과정과 도구 호출을 결합해 자율성을 극대화한 세계 최초의 모델 Speciale 모델, IMO 및 ICPC에서 금메달 수준의 성적으로 압도적 논리력 증명

DeepSeek-V3.2 공개, GPT-5급 성능의 에이전틱 AI 시대

•DeepSeek-V3.2 정식 출시, 추론 벤치마크에서 GPT-5급 성능 달성
•사고 과정과 도구 호출을 결합해 자율성을 극대화한 세계 최초의 모델
•Speciale 모델, IMO 및 ICPC에서 금메달 수준의 성적으로 압도적 논리력 증명

중국의 AI 스타트업 DeepSeek(深度求索)이 최신 플래그십 모델인 'DeepSeek-V3.2'의 정식 버전을 출시하며 업계에 큰 충격을 주고 있다. 이번 신모델은 기존 실험판의 피드백을 바탕으로 추론의 정밀도와 출력 효율성을 고도화했다는 평가를 받는다. 특히 사고 과정(Chain-of-Thought)을 유지하면서도 외부 검색이나 계산 도구를 자유롭게 호출할 수 있는 능력이 돋보인다. 이를 통해 AI가 복잡한 문제를 스스로 해결하는 에이전틱 AI로서의 실용성을 한 단계 더 끌어올렸다.

개발팀은 정답을 찾기는 어렵지만 검증은 쉬운 1,800개 이상의 시뮬레이션 환경을 구축하고, 이를 통해 대규모 강화 학습을 진행했다. 약 8만 5,000건의 복잡한 지시가 포함된 데이터를 학습한 덕분에 특정 작업에 얽매이지 않는 강력한 범용성을 확보할 수 있었다. 실제로 DeepSeek-V3.2는 주요 벤치마크에서 GPT-5에 필적하는 점수를 기록했다. 이는 오픈소스 모델이 클로즈드 모델과 어깨를 나란히 하게 된 역사적 전환점으로 평가받는다.

함께 발표된 'DeepSeek-V3.2-Speciale'은 계산 자원을 아낌없이 투입해 깊이 생각하는 장고형(Long-thinking) 모델이다. 이 모델은 국제 수학 올림피아드(IMO 2025)와 국제 대학생 프로그래밍 경시대회(ICPC) 같은 세계 최고 수준의 지능 경연에서 금메달급 성적을 거두는 기염을 토했다. 일상적인 대화보다는 엄밀한 논리 검증이 필요한 극한의 과업에서 진정한 진가를 발휘하는 모델이라 할 수 있다.

현재 해당 모델들은 공식 웹사이트와 앱, API를 통해 전면 공개된 상태다. 특히 개발자들을 위해 코딩 지원 도구인 Claude Code와의 통합을 표준으로 지원하며 기존 개발 워크플로우를 극적으로 개선했다. 또한 Sparse Attention 메커니즘을 채택해 방대한 정보를 처리하면서도 계산 비용과 대기 시간을 효과적으로 억제했다. DeepSeek은 이번 발표를 통해 차세대 에이전틱 AI의 새로운 표준을 제시하고 있다.

중국의 AI 스타트업 DeepSeek(深度求索)이 최신 플래그십 모델인 'DeepSeek-V3.2'의 정식 버전을 출시하며 업계에 큰 충격을 주고 있다. 이번 신모델은 기존 실험판의 피드백을 바탕으로 추론의 정밀도와 출력 효율성을 고도화했다는 평가를 받는다. 특히 사고 과정(Chain-of-Thought)을 유지하면서도 외부 검색이나 계산 도구를 자유롭게 호출할 수 있는 능력이 돋보인다. 이를 통해 AI가 복잡한 문제를 스스로 해결하는 에이전틱 AI로서의 실용성을 한 단계 더 끌어올렸다.

개발팀은 정답을 찾기는 어렵지만 검증은 쉬운 1,800개 이상의 시뮬레이션 환경을 구축하고, 이를 통해 대규모 강화 학습을 진행했다. 약 8만 5,000건의 복잡한 지시가 포함된 데이터를 학습한 덕분에 특정 작업에 얽매이지 않는 강력한 범용성을 확보할 수 있었다. 실제로 DeepSeek-V3.2는 주요 벤치마크에서 GPT-5에 필적하는 점수를 기록했다. 이는 오픈소스 모델이 클로즈드 모델과 어깨를 나란히 하게 된 역사적 전환점으로 평가받는다.

함께 발표된 'DeepSeek-V3.2-Speciale'은 계산 자원을 아낌없이 투입해 깊이 생각하는 장고형(Long-thinking) 모델이다. 이 모델은 국제 수학 올림피아드(IMO 2025)와 국제 대학생 프로그래밍 경시대회(ICPC) 같은 세계 최고 수준의 지능 경연에서 금메달급 성적을 거두는 기염을 토했다. 일상적인 대화보다는 엄밀한 논리 검증이 필요한 극한의 과업에서 진정한 진가를 발휘하는 모델이라 할 수 있다.

현재 해당 모델들은 공식 웹사이트와 앱, API를 통해 전면 공개된 상태다. 특히 개발자들을 위해 코딩 지원 도구인 Claude Code와의 통합을 표준으로 지원하며 기존 개발 워크플로우를 극적으로 개선했다. 또한 Sparse Attention 메커니즘을 채택해 방대한 정보를 처리하면서도 계산 비용과 대기 시간을 효과적으로 억제했다. DeepSeek은 이번 발표를 통해 차세대 에이전틱 AI의 새로운 표준을 제시하고 있다.