Mistral AI, 문서 파싱 모델 Mistral OCR 4 출시
- •Mistral AI가 바운딩 박스, 블록 분류, 단어별 신뢰도 점수를 지원하는 Mistral OCR 4를 출시했다.
- •해당 모델은 170개 언어를 지원하며, OlmOCRBench에서 85.20점을 기록했다.
- •API 이용료는 1,000페이지당 4달러이며, 배치 처리 시 50% 할인된 2달러에 제공된다.
Mistral AI는 2026년 6월 23일, 구조화된 콘텐츠 추출을 위해 설계된 문서 파싱 모델 Mistral OCR 4를 공개했다. 이 모델은 텍스트 추출과 함께 바운딩 박스 정보, 제목·표·수식·서명 등을 식별하는 블록 분류 기능을 제공하며, 단어와 페이지 단위의 신뢰도 점수를 함께 생성한다. 지원 언어는 10개 언어군에 걸친 170개로, 기존 시스템이 취약했던 저자원 언어에서도 높은 정확도를 유지한다. 기업은 데이터 거버넌스 및 규제 준수를 위해 단일 컨테이너 형태로 자사 환경에 직접 배포할 수 있다.
성능 평가에서 Mistral OCR 4는 독립 평가자들로부터 기존 선도적인 문서 AI 시스템 대비 72%의 평균 승률을 기록했다. 공개 벤치마크인 OlmOCRBench에서는 85.20점, OmniDocBench에서는 93.07점을 획득했다. 다만 Mistral AI는 벤치마크 데이터에 포함된 잘못된 정답 라벨이나 수학 표기 불일치가 총점에 영향을 줄 수 있다고 덧붙였다. 본 모델은 법률이나 의료와 같은 고위험 분야의 의사결정보다는 검색 증강 생성(RAG)이나 자동화된 에이전트 워크플로우를 위한 데이터 입력 엔진으로 활용하는 데 초점을 맞췄다.
개발자는 API 또는 Mistral Studio를 통해 모델을 사용할 수 있다. 가격은 1,000페이지당 4달러로 책정되었으며, 배치(Batch) API 사용 시 50% 할인된 2달러에 이용 가능하다. 특정 스키마에 맞춘 구조화된 JSON 출력을 제공하는 Document AI 기능은 1,000페이지당 5달러이다. 모델은 Amazon SageMaker와 Microsoft Foundry 등 다양한 플랫폼을 통해 배포된다. 또한 오픈소스 Mistral Search Toolkit과의 연동을 통해 인용 가능한 데이터를 기업용 검색 및 검색 파이프라인에 직접 통합할 수 있다.