아마존 베드락 리전 간 추론 도입으로 AI 안정성 확보
- •아마존 베드락이 AI 처리량과 애플리케이션 신뢰성을 높이기 위해 '리전 간 추론' 기능을 출시했다.
- •지리적 프로필 설정을 통해 특정 경계 내에서만 데이터를 처리함으로써 지역 규제 준수가 가능해졌다.
- •글로벌 네트워크 용량을 활용하면서도 대상 리전에는 데이터를 저장하지 않는 보안 아키텍처를 구현했다.
아마존 베드락(Amazon Bedrock)이 생성형 인공지능(AI) 애플리케이션의 유연한 확장을 지원하기 위해 '리전 간 추론(CRIS)' 프로필 기능을 전격 출시했다. 해당 기능은 특정 리전에 트래픽이 몰리는 상황에서도 높은 성능과 서비스 안정성을 유지할 수 있도록 AI 처리 요청을 다양한 AWS 데이터 센터로 자동 라우팅하는 것이 핵심이다. 특히 아마존의 이 시스템은 연산 처리와 데이터 저장을 물리적으로 분리하는 아키텍처를 채택했다. 이에 따라 AI 추론 요청이 다른 국가의 리전에서 처리되더라도, 고객의 민감한 데이터나 활동 로그는 최초의 소스 위치에 그대로 유지되어 보안성을 극대화했다.
사용자는 목적에 따라 지리적 방식과 글로벌 방식의 CRIS 프로필 중 하나를 선택할 수 있다. 지리적 방식은 미국이나 유럽 등 특정 권역 내에서만 데이터 처리가 이루어지도록 제한하는 기능을 제공한다. 이는 기업들이 지역 데이터 거버넌스 및 데이터 거주권 관련 법규를 준수하면서도 AI 성능을 개선할 수 있도록 돕는 장치다. 반면 글로벌 방식은 전 세계 모든 지원 리전의 가용 컴퓨팅 자원을 실시간으로 활용하여 처리 속도를 극대화한다. 또한 데이터 처리 위치에 대해 유연한 정책을 보유한 글로벌 기업들은 이를 통해 전 세계적인 네트워크 용량을 낭비 없이 사용하여 운영 효율성을 높일 수 있다.
이러한 고도화된 기능을 안전하게 구현하기 위해서는 정밀한 보안 구성이 필수적이다. 시스템 관리자는 AWS의 ID 및 액세스 관리(IAM)를 통해 AI 연구 기관인 앤스로픽(Anthropic) 등이 개발한 기초 모델(Foundation Model)에 대해 다중 리전 요청을 보낼 수 있는 권한을 개별 사용자별로 엄격히 통제할 수 있다. 또한 서비스 제어 정책(SCP)을 사용하는 조직은 글로벌 추론 기능이 원활히 작동할 수 있도록 '지정되지 않은(unspecified)' 리전 파라미터를 허용하는 설정을 추가해야 한다. 이를 통해 대규모 언어 모델(LLM) 시스템은 기존의 지역적 제한에 가로막히지 않고 국경을 넘나들며 지능적으로 트래픽을 배분하게 된다.
실제로 이번 업데이트는 기업들이 데이터 주권 문제를 해결함과 동시에 AI 모델의 처리 용량을 획기적으로 늘릴 수 있는 중요한 이정표가 될 전망이다. 다만 이러한 복잡한 인프라를 성공적으로 운영하기 위해서는 기업 내부의 보안 가이드라인과 AWS의 정책 설정 간의 긴밀한 정렬이 요구된다. 또한 향후 다양한 언어와 문화권을 대상으로 하는 AI 서비스가 늘어남에 따라, 리전 간의 물리적 거리를 극복하는 이러한 추론 최적화 기술은 생성형 AI 서비스의 표준으로 자리 잡을 것으로 보인다. 이에 따라 기업 사용자들은 인프라 제약에서 벗어나 더욱 창의적이고 강력한 AI 비즈니스 모델을 구상할 수 있게 되었다.