AWS, 동남아시아 전역에 Claude 글로벌 추론 서비스 확대
AWS ML Blog
2026년 2월 25일 (수)
- •AWS가 동남아시아 5개 시장을 대상으로 Claude 4.5 및 4.6 모델의 글로벌 추론 서비스를 시작했다.
- •CRIS 아키텍처를 통해 요청을 전 세계로 분산하여 시스템 회복탄력성과 처리량을 극대화했다.
- •분산 추론 환경에서도 보안 및 컴플라이언스 로그에 대한 현지 데이터 거주성을 보장한다.
아마존 웹 서비스(AWS)가 동남아시아와 대만 지역을 대상으로 최신 Anthropic Claude 모델에 대한 글로벌 지역 간 추론(CRIS) 기능을 공식 출시했다. 이번 아키텍처 변화를 통해 싱가포르와 자카르타 등의 현지 개발자들은 20개 이상의 글로벌 AWS 리전에 작업을 분산 처리함으로써 Claude Opus 4.6 및 Sonnet 4.6의 성능을 온전히 활용할 수 있게 됐다.
이 기술의 핵심 혁신은 이른바 '지능형 요청 라우팅'에 있다. 트래픽이 몰리는 시간대에 로컬 데이터 센터에서 병목 현상이 발생하는 대신, 시스템이 가용 용량이 있는 곳으로 작업 부하를 자동으로 재전송하는 방식이다. 이를 통해 중단 없는 서비스가 필수적인 현대적 자율 에이전트가 복잡한 물류나 금융 워크플로우를 안정적으로 처리할 수 있는 고가용성 환경을 구축했다.
특히 이러한 글로벌 확장에도 불구하고 데이터 주권은 철저히 보호된다는 점이 주목할 만하다. 일시적인 계산 작업인 추론은 타 리전에서 수행될 수 있으나, 감사를 위한 로그나 AI 지식 베이스의 설정값 등 저장된 데이터는 사용자의 원래 지역 내에 엄격히 보관된다. 결과적으로 AWS는 서비스 할당량과 처리량 관리를 간소화함으로써 지역 스타트업과 기업들이 단순한 프로토타입을 넘어 상용 서비스 규모의 AI 시스템으로 성공적으로 전환할 수 있는 명확한 경로를 제시하고 있다.