미스트랄 AI, 고성능 문서 처리 모델 미스트랄 OCR 3 출시
- •미스트랄 AI가 이전 버전 대비 성능을 74% 개선하여 손글씨와 복잡한 표까지 인식하는 미스트랄 OCR 3를 공개했다.
- •이 모델은 1,000페이지당 2달러라는 합리적인 가격으로 제공되며 드래그 앤 드롭 방식의 분석 도구도 함께 지원한다.
- •고해상도 문서 추출 기술을 통해 정적인 데이터를 정형화함으로써 자율적으로 업무를 수행하는 에이전트형 AI 구축을 돕는다.
미스트랄 AI가 문서 처리의 정확도와 비용 효율성을 획기적으로 높인 '미스트랄 OCR 3'를 전격 발표했다. 이 모델은 스캔된 문서나 난해한 손글씨를 분석하는 고난도 작업에서 이전 버전보다 74% 향상된 성능을 보여준다. 특히 방대한 컴퓨팅 자원을 요구하는 기존의 기업용 도구들과 달리, 상대적으로 가벼운 크기에도 불구하고 대형 모델들을 능가하는 성과를 거두었다는 점이 주목할 만하다. 또한 시각적 문서를 마크다운이나 HTML 표 태그가 포함된 정형 데이터로 변환하는 능력이 탁월하여, 기존 텍스트 추출 방식에서 손실되기 쉬운 병합된 셀이나 다중 행 머리글과 같은 복잡한 레이아웃을 완벽하게 보존한다.
개발자들은 전용 인터페이스나 '도큐먼트 AI 플레이그라운드'라는 간편한 도구를 통해 PDF 파일을 마크다운이나 JSON 형식으로 손쉽게 변환할 수 있다. 실제로 이번 출시는 스스로 계획을 세우고 도구를 사용해 복잡한 과업을 완수하는 '에이전트형 AI(Agentic AI)'를 구축하는 데 매우 중요한 이정표가 될 전망이다. 이미지나 PDF와 같이 검색이 불가능한 이른바 '죽은 데이터'를 신뢰할 수 있는 텍스트 정보로 바꿈으로써 AI가 후속 추론을 원활하게 수행할 수 있는 기반을 마련해주기 때문이다. 이에 따라 IDC의 AI 및 자동화 부문 연구 이사인 팀 로(Tim Law)는 고해상도 데이터 추출 기술이 기업의 데이터 아카이브에서 가치를 창출하는 핵심 토대라고 강조했다.
기업 도입의 주요 관건인 비용 측면에서도 파격적인 경쟁력을 확보했다. 미스트랄 AI는 서비스 요금을 1,000페이지당 2달러로 책정했으며, 대량 처리 시 추가 할인 혜택을 제공한다. 한편 보안 요건이 엄격한 조직을 위해 민감한 정보가 외부로 유출되지 않도록 자체 인프라 내에서 데이터를 처리할 수 있는 셀프 호스팅 옵션도 지원한다. 이러한 유연성과 경제성은 방대한 양의 행정 업무를 자동화하려는 기업들에게 강력한 대안이 될 것으로 보인다. 결과적으로 고성능 OCR 기술은 단순한 데이터 변환을 넘어 기업의 지적 자산을 실질적인 업무 지능으로 전환하는 가교 역할을 할 것으로 기대된다.