Amazon Bedrock AgentCore 기반 멀티 테넌트 AI 아키텍처 구현
- •Amazon Bedrock AgentCore는 공유 인프라 기반의 멀티 테넌트 AI 아키텍처를 지원한다.
- •시스템은 JWT 클레임을 활용하여 계층, 테넌트, 사용자 간의 엄격한 보안 격리를 보장한다.
- •헬스케어 사례에서 Mistral Ministral 3 8B와 GPT OSS 120B 모델을 사용하여 계층별 차별화 서비스를 구현했다.
Amazon Bedrock AgentCore를 활용한 멀티 테넌트 AI 애플리케이션 구축은 테넌트 격리, 정밀한 비용 산정, 그리고 계층화된 서비스 제공을 위한 견고한 설계를 요구한다. 제시된 솔루션은 계층, 테넌트, 사용자라는 계층적 구조를 통해 보안성과 운영 효율성을 동시에 확보했다. 특히 여러 테넌트가 인프라를 공유하는 풀 모델(Pool Model)을 적용해 자원 활용률을 극대화하면서도, 식별자 기반의 접근 정책으로 논리적 분리를 유지한다.
아키텍처의 핵심 예시인 헬스케어 AI 비서 서비스는 두 가지 서비스 계층을 제공한다. 소규모 병원을 위한 기본 계층(Basic Tier)은 효율적인 문서 검색을 위해 Mistral Ministral 3 8B Instruct 모델을 사용하며, 종합병원을 겨냥한 프리미엄 계층(Premium Tier)은 고도화된 추론 및 웹 검색 기능을 위해 OpenAI GPT OSS 120B 모델을 운용한다. 서비스 계층별 권한은 선언적 정책을 통해 테넌트 요금제에 따라 도구 접근을 제한하거나 허용하는 방식으로 제어된다.
AgentCore의 6가지 핵심 기능은 이러한 멀티 테넌트 프레임워크를 뒷받침한다. 런타임 환경은 격리된 마이크로 VM을 통해 테넌트 단위의 컴퓨팅 자원을 분리한다. 또한 Amazon Cognito와 연동된 ID 관리 시스템은 JWT 클레임을 통해 시스템 전반에 테넌트 맥락을 전달함으로써, 개별 서비스마다 별도의 필터링 로직 없이도 안전한 데이터 접근을 가능하게 한다.
메모리 및 도구 접근 권한은 TVM(Token Vending Machine) 패턴과 ABAC를 통해 더욱 강화된다. 시스템은 계층, 클리닉 ID, 사용자 ID와 같은 세션 태그가 포함된 역할을 부여하여 자격 증명이 요청 테넌트의 네임스페이스 내에서만 작동하도록 제한한다. 또한 AgentCore Gateway는 모델 컨텍스트 프로토콜을 활용해 외부 도구와의 상호작용을 관리한다. 이 게이트웨이는 테넌트 헤더를 자동으로 전파하여 전체 요청 생명주기 동안 별도의 커스텀 코드 없이도 데이터 격리 상태를 유지한다.