Mistral AI, 마이크로소프트 Foundry에 고정밀 'Document AI' 출시
- •Mistral Document AI는 고도의 OCR 기술과 지능형 이해 기능을 결합하여 복잡한 비정형 문서를 99%의 정확도로 처리한다.
- •이 모델은 다단 레이아웃, 표, 수기 주석까지 인식하며 이를 기계가 읽을 수 있는 JSON 또는 Markdown 형식으로 변환한다.
- •마이크로소프트 Foundry 사용자는 오픈소스 가속기인 ARGUS를 통해 엔드투엔드 문서 자동화 파이프라인을 구축할 수 있다.
기업들은 오랫동안 PDF나 스캔된 송장과 같은 비정형 데이터에 갇힌 '다크 데이터' 처리에 큰 어려움을 겪어왔다. 기존의 광학 문자 인식 기술은 단순히 텍스트를 디지털화하는 데는 능숙했으나, 복잡한 표나 수기 메모처럼 문서의 의미를 결정짓는 구조적 세부 사항을 파악하는 데는 한계가 명확했다. 이에 Mistral AI는 고도의 시각 인식과 깊이 있는 언어 이해력을 결합한 새로운 Document AI 모델을 마이크로소프트 Foundry 플랫폼을 통해 공개하며 이러한 기술적 간극을 메우고 있다.
기술적 핵심은 시각적 추출을 담당하는 mistral-ocr-2512와 문맥 분석을 수행하는 mistral-small-2506이라는 두 모델의 긴밀한 협업에 있다. 이러한 조합 덕분에 시스템은 다양한 언어와 복잡한 레이아웃 속에서도 99%의 높은 정확도를 유지할 수 있게 되었다. 특히 텍스트를 단순하게 나열하는 표준 도구들과 달리, 이 모델은 데이터를 JSON이나 Markdown 같은 구조화된 형식으로 생성한다. 이러한 역량은 데이터 포인트 간의 관계를 보존하는 것이 데이터 자체만큼이나 중요한 규제 산업 분야의 기업들에게 매우 필수적이다.
한편, 마이크로소프트는 모델 접근과 실제 배포 사이의 장벽을 낮추기 위해 오픈소스 솔루션 가속기인 ARGUS를 도입했다. ARGUS는 데이터 입력부터 스키마 매핑까지 처리하는 사전 구축된 파이프라인 역할을 수행하며, 개발자가 필요에 따라 다양한 서비스 제공자를 유연하게 선택할 수 있도록 지원한다. 실제로 이러한 도구들은 기술 진입 장벽을 낮춤으로써, 기업이 정밀도를 희생하지 않고도 전 세계적인 규모로 문서 워크플로우 자동화를 실현할 수 있는 발판을 마련했다.