Amazon Bedrock, 이제 비디오·오디오 검색도 지원
- •Amazon Bedrock Knowledge Bases가 비디오 및 오디오 콘텐츠에 대한 멀티모달 검색을 공식 지원한다.
- •Amazon Nova 멀티모달 임베딩 모델을 통해 통합된 벡터 공간에서 교차 모달 검색이 가능해졌다.
- •새로운 Bedrock Data Automation 기능은 멀티미디어를 텍스트로 변환해 정교한 정보 검색을 돕는다.
Amazon Web Services(AWS)가 Amazon Bedrock Knowledge Bases의 기능을 대폭 확장하며 멀티모달 검색 기능을 정식 출시했다. 이번 업데이트로 기업들은 텍스트와 정적인 이미지를 넘어 비디오와 오디오 파일까지 검색 증강 생성 (RAG) 워크플로우에 직접 통합할 수 있게 됐다. 복잡한 맞춤형 파이프라인을 구축할 필요가 없다는 점이 핵심이다. 사용자는 이제 회의 녹화본, 제품 데모, 교육용 영상 등 다양한 포맷의 데이터를 하나의 완전 관리형 서비스 내에서 손쉽게 인덱싱할 수 있다. 이 변화의 중심에는 Amazon Nova 멀티모달 임베딩 모델이 자리한다. 이 모델은 서로 다른 미디어 유형을 하나의 '벡터 공간'으로 통합하여 관리하며 데이터 사이의 관계를 수학적으로 정의한다. 덕분에 이른바 '교차 모달 검색'이 가능해졌다. 사용자가 참조 이미지를 업로드해 영상 속 특정 장면을 찾거나, 텍스트 설명만으로 카탈로그에서 시각적으로 유사한 제품을 찾아내는 식이다. 높은 정확도가 필요한 법률 준수나 콜센터 분석 환경을 위해 Bedrock Data Automation 기능도 함께 제공된다. 이 기능은 멀티미디어를 상세한 텍스트와 전사문으로 변환한 뒤 임베딩하여 검색의 정밀도를 극대화한다. 사용 편의성 측면에서도 괄목할 만한 진전이 있었다. Bedrock Knowledge Bases는 비디오와 오디오를 5초에서 30초 단위의 세그먼트로 자동 분할하여 검색 효율을 높였다. 각 세그먼트에는 정확한 타임스탬프 메타데이터가 유지되어, 사용자가 원본 영상의 필요한 시점으로 즉시 이동할 수 있게 돕는다. 이러한 RAG 파이프라인의 간소화는 현대 기업의 복잡한 데이터 저장소에서 정보를 더 빠르고 정확하게 추출하려는 개발자들의 진입 장벽을 크게 낮출 것으로 기대된다.