바이촨, GPT-5.2 능가하는 235B 의료 모델 출시
HuggingFace
2026년 2월 10일 (화)
- •바이촨 인텔리전트가 2,350억 개의 매개변수를 보유한 의료 전문 파운데이션 모델인 Baichuan-M3를 공개했다.
- •이 모델은 HealthBench 평가에서 GPT-5.2를 능가했으며, 임상 추론 분야에서 세계 최고 수준의 성능을 기록했다.
- •특히 능동적인 환자 문진과 안전성을 위한 적응형 할루시네이션 억제 기술을 도입해 의료 현장 적합성을 높였다.
바이촨 인텔리전트(Baichuan Intelligent Technology)가 임상 환경의 복잡한 문제를 해결하기 위해 설계된 2,350억 매개변수 규모의 거대 모델 Baichuan-M3를 선보였다. 이 모델은 단순히 수동적으로 질문에 답하는 시스템을 넘어 전문의의 진단 과정을 모방하도록 설계된 것이 특징이다. 특히 단순한 텍스트 예측 대신 체계적인 의료 문진 과정을 학습시키는 특화 훈련 파이프라인을 통해, 의료진의 의사결정을 능동적으로 지원하는 새로운 패러다임을 제시했다.
Baichuan-M3의 핵심 강점 중 하나는 능동적인 정보 획득 능력이다. 모델은 사용자의 초기 질문에만 의존하지 않고 스스로 누락된 정보를 식별해 명확한 질문을 던짐으로써 환자의 모호한 상태를 해결한다. 또한 장기 추론 능력을 통해 여러 차례 이어지는 대화 속에서도 흩어진 증상과 과거 병력을 연결하여 일관성 있는 진단을 도출해낼 수 있다.
또한 의료 AI의 가장 큰 위험 요소인 잘못된 정보 제공을 방지하기 위해 적응형 할루시네이션 억제 기술을 통합했다. 이를 통해 실제 상담 과정에서 모델이 철저히 사실에 기반하도록 보장한다. 실제로 HealthBench와 ScanBench 프레임워크를 활용한 성능 평가 결과, Baichuan-M3는 임상 문진 및 안전성 항목에서 GPT-5.2를 앞서는 성과를 거두었다. 현재 전체 235B 모델과 다양한 양자화 버전은 Hugging Face에 오픈 웨이트 형식으로 공개되어 연구자들의 자유로운 접근이 가능하다.