AWS, Amazon Bedrock 기반 지능형 문서 처리 가이드 공개
- •AWS가 Amazon Bedrock Data Automation을 활용한 지능형 문서 처리 파이프라인 구축 가이드를 발표했다.
- •이 아키텍처는 최대 3,000페이지 분량의 텍스트, 표, 시각적 요소를 포함한 멀티모달 문서 처리를 자동화한다.
- •전문 에이전트와 검색 증강 생성(RAG)을 도입해 금융 및 법률 문서의 의미론적 검색과 교차 검증을 지원한다.
AWS는 Amazon Bedrock과 Data Automation(BDA) 서비스를 활용해 지능형 문서 처리 파이프라인을 구축하는 기술 가이드를 발간했다. 이번 아키텍처는 보험 청구서, 송장, 의료 기록 등 복잡한 멀티모달 문서를 처리하는 과제를 해결한다. 기존의 광학 문자 인식(OCR) 시스템이 문맥 파악에 한계가 있던 점을 보완한 것이다. BDA는 워크플로우의 핵심 엔진으로서, 최대 3,000페이지 및 500MB 용량의 PDF와 스캔 문서를 단일 API로 처리한다. 이를 통해 문서 분류, 논리적 분할, 콘텐츠 추출 과정을 자동화하여 수작업 오류를 줄인다.
처리 아키텍처는 입력, 추출 및 저장, 지능, 에이전트 조정의 4개 계층으로 구성된다. 입력 계층은 Amazon S3를 거쳐 AWS Step Functions가 워크플로우를 조율한다. BDA는 문서를 분할한 뒤 사전 구성된 청구서나 보고서 등의 설계도(Blueprint)에 맞춰 데이터를 추출한다. 하나의 프로젝트에서 최대 40개의 서로 다른 문서 설계도를 지원해 다양한 서식에도 정밀한 데이터 추출이 가능하다. 추출 계층은 읽기 순서에 따른 텍스트, 표 구조, 차트와 그래프 등의 시각적 분석 정보를 구조화된 JSON 데이터로 생성한다.
지능 계층은 Amazon Bedrock Knowledge Bases와 Amazon OpenSearch Serverless를 결합하여 의미론적 검색과 검색 증강 생성(RAG)을 수행한다. 이를 통해 여러 문서에 걸친 복잡한 질의가 가능하다. 마지막으로 에이전트 조정 계층은 Amazon Bedrock AgentCore Runtime에서 구동되는 전용 에이전트를 활용한다. 예를 들어 상업용 부동산 분야에서 에이전트는 재무 차트로부터 순운영소득(NOI) 예측치나 수익률 추이를 추출한다. 시스템은 조정자 에이전트를 통해 외부 API 데이터와 대조해 추출된 수치를 검증한다. 이러한 이벤트 기반 아키텍처는 기업이 방대한 비정형 문서를 자연어 질의를 통해 통찰로 전환하도록 돕는다.