AWS, 남아공에 Claude 4.5 글로벌 추론 도입
- •Amazon Bedrock이 남아프리카 공화국에서 Claude 4.5 모델을 위한 글로벌 교차 리전 추론 기능을 지원한다.
- •새로운 라우팅 시스템이 전 세계로 워크로드를 분산해 높은 처리량과 안정성을 보장한다.
- •케이프타운 내 지역 모니터링을 통해 현지 데이터 보호법(POPIA) 준수 환경을 유지한다.
아마존 웹 서비스(AWS)가 글로벌 교차 리전(Cross-Region) 추론 시스템을 통해 남아프리카 공화국 케이프타운 리전에 Anthropic의 Claude 4.5 모델을 출시했다. 이번 업데이트는 아프리카 기업들이 겪던 처리량 병목 현상을 해결하기 위한 조치로, 전 세계 AWS 데이터 센터로 계산 작업을 분산해 트래픽이 몰리는 시간대에도 애플리케이션의 응답성을 유지하도록 설계됐다. 특히 AI가 답변을 생성하는 ‘추론’ 과정은 전 세계적으로 처리되지만, 민감한 로그와 메타데이터는 케이프타운에 현지화되어 보관된다. 이는 남아공의 개인정보 보호법(POPIA)과 같은 현지 데이터 규제를 준수하기 위함이다.
개발자들은 단일 글로벌 모델 ID를 사용하여 복잡한 과정 없이 서비스를 확장할 수 있다. 플랫폼이 자동으로 AWS 네트워크를 탐색하여 가장 빠른 요청 경로를 찾아내기 때문이다. 또한, 자주 사용되는 문맥을 재사용해 비용과 지연 시간을 줄여주는 프롬프트 캐싱 기능도 함께 지원한다. 다만, 서로 다른 지리적 영역 간에 안전한 라우팅을 보장하려면 리전별 및 글로벌 파운데이션 모델 정의를 포함하는 특정 IAM 권한 설정이 필요하다.
한편, AWS는 효율적인 토큰 관리를 위해 '번다운 레이트(Burndown rate)' 방식을 도입했다. 특정 모델의 경우 출력 토큰 하나가 입력 토큰보다 5배 많은 쿼터를 소비하는데, 이는 대규모 서비스 확장과 예산 수립 시 고려해야 할 핵심 요소다. 결과적으로 이번 출시는 글로벌 컴퓨팅 파워와 필수적인 현지 거버넌스를 결합함으로써, 아프리카 기술 생태계 전반에 고성능 대규모 언어 모델 (LLM) 접근성을 크게 확대할 것으로 기대된다.