딥시크 R1 공개, 오픈소스 AI 추론 기술의 새 지평
- •딥시크 R1은 고도화된 강화학습 기술을 통해 압도적인 논리적 추론 능력을 확보했다.
- •글로벌 연구 생태계를 지원하기 위해 성능을 압축한 다양한 증류 모델들이 오픈소스로 함께 공개되었다.
- •라마와 큐웬 기반의 소형 증류 모델들은 경량 구조에서도 최상위권의 추론 성능을 입증했다.
인공지능 개발 스타트업 딥시크(DeepSeek)가 대규모 강화학습 기술을 집약하여 개발한 차세대 추론 모델 ‘DeepSeek-R1’을 전격 공개하며 업계에 큰 파장을 일으키고 있다. 이번에 선보인 R1 모델은 기존의 전형적인 지도 학습 기반 미세 조정 방식에서 탈피하여 인공지능이 독립적으로 사고하고 추론하는 법을 스스로 익힐 수 있음을 명확히 보여주었다. 실제로 초기 실험 모델인 R1-Zero는 순수 강화학습만으로도 고도의 추론 능력이 발현될 수 있다는 사실을 입증했으며, 최종 공개된 R1 모델은 여기에 초기 콜드 스타트 데이터를 결합하여 가독성과 결과물의 품질을 대폭 개선했다. 이에 따라 인공지능은 과거 인간의 직관이 필수적이었던 복잡한 논리적 난제들을 더욱 정교하고 일관성 있게 해결할 수 있는 능력을 갖추게 되었다.
특히 딥시크 R1은 수학 연산과 정밀 코딩 분야에서 오픈AI의 최신 모델인 o1과 대등한 성능을 기록하며 기술적 우수성을 전 세계에 증명했다. 딥시크 측은 글로벌 연구 생태계의 활성화를 도모하기 위해 R1 모델 본체와 더불어 메타의 라마(Llama) 및 알리바바의 큐웬(Qwen) 아키텍처를 기반으로 설계된 6종의 증류 모델을 오픈소스로 함께 배포했다. 이러한 소형 증류 모델들은 대규모 컴퓨팅 자원을 보유하지 못한 환경에서도 최상위권의 추론 성능을 발휘할 수 있도록 설계된 것이 특징이다. 실제로 딥시크-R1-증류-큐웬-32B 모델의 경우 여러 벤치마크 테스트에서 오픈AI의 o1-mini를 상회하는 성적을 거두며 오픈소스 진영의 효율성 기준을 새롭게 정립했다는 찬사를 받고 있다.
한편 딥시크 R1 모델은 상업적 목적의 활용과 추가적인 모델 학습에 제한이 없도록 개방적인 라이선스 정책을 채택하고 있다. 다만 증류된 버전의 모델을 사용할 경우에는 각각의 기반이 된 라마나 큐웬의 라이선스 조항을 준수해야 한다는 조건이 붙는다. 딥시크는 현재 자사의 공식 웹 플랫폼과 API 서비스를 통해 모델 접근성을 높여 기술의 범용적인 확산을 적극적으로 장려하고 있다. 개발자들은 모델의 잠재력을 최대한 끌어올리기 위해 시스템 프롬프트를 배제한 사용자 전용 프롬프트를 활용하고, 0.5에서 0.7 사이의 온도 설정을 유지할 것을 권장받는다. 또한 이번 발표는 고도화된 추론 기술에 대한 진입 장벽을 획기적으로 낮춤으로써 전 세계 개발자들이 더욱 혁신적인 AI 도구를 제작할 수 있는 기틀을 마련했다는 점에서 의미가 깊다.