AWS, Nova 2 Lite와 Claude로 문서 처리 효율화
- •AWS가 연감 디지털화를 위해 Nova 2 Lite와 Claude Sonnet 4.6을 결합한 2단계 모델 파이프라인을 구축했다.
- •3,122건의 매칭 테스트에서 93.3%의 신뢰도를 달성했으며, 단일 모델 대비 비용을 3분의 1 수준으로 절감했다.
- •고정된 이미지당 가격과 적응형 사고 기능을 통해 대규모 페이지 처리에 필요한 비용 예측 가능성과 확장성을 제공한다.
Amazon Web Services(AWS)가 Amazon Bedrock 상에서 Amazon Nova 2 Lite와 Anthropic의 Claude Sonnet 4.6을 결합한 비용 최적화 2단계 파이프라인을 선보였다. 해당 아키텍처는 효율성 증대를 위해 작업을 분리한다. Nova 2 Lite는 단일 API 호출로 사진 위치, 이름, 페이지 메타데이터를 추출하는 멀티모달 작업을 수행하며, 이어 Claude Sonnet 4.6이 적응형 사고 능력을 활용해 페이지 레이아웃에 따른 이름과 얼굴의 공간적 매핑을 담당한다. 이러한 접근 방식은 중복 처리를 방지하여 비용을 크게 낮춘다.
336페이지의 스캔된 연감을 대상으로 테스트한 결과 높은 신뢰도가 확인됐다. 총 3,122건의 이름-얼굴 매핑 중 93.3%가 0.95 이상의 신뢰도 점수를 기록했으며, 0.90 미만은 0.3%에 불과했다. 처리 비용은 페이지당 약 $0.033로 단일 비전-언어 모델을 사용할 때보다 3분의 2가량 저렴하다. Nova 2 Lite는 해상도나 파일 크기에 상관없이 이미지당 고정 가격을 적용해 대규모 작업의 비용 예측을 용이하게 한다. Claude의 적응형 사고 기능은 인물 사진 위주의 단순한 그리드부터 복잡한 단체 사진까지 레이아웃의 복잡도에 따라 내부 추론 깊이를 자동으로 조절한다.
개발자는 GitHub의 AWS 샘플 저장소에서 제공하는 Jupyter 노트북과 소스 코드를 통해 이 솔루션을 구현할 수 있으며, Python 3.10 이상 버전과 boto3 SDK가 필요하다. 기본 파이프라인 외에도 비용을 추가로 절감할 수 있는 방법들이 있다. 배치 추론은 야간 작업 시 50%의 할인을 제공하며, 프롬프트 캐싱은 캐시된 프롬프트 토큰 비용을 최대 90%까지 감소시킨다. 또한, Claude 설정에서 budgetTokens 상한선을 지정해 추론 비용을 관리하는 것도 가능하다. 탐지 단계와 추론 단계를 분리함으로써 개발자는 추후 더 발전된 모델이 등장할 경우 각 구성 요소를 독립적으로 조정하거나 업그레이드할 수 있는 모듈식 아키텍처를 확보하게 된다.