아마존, 커스텀 Nova 모델 관리형 추론 서비스 출시
- •Amazon SageMaker, 커스텀 Nova Micro, Lite 및 2 Lite 모델을 위한 관리형 추론 기능 도입
- •GPU 활용도, 오토스케일링, 컨텍스트 길이 설정을 통한 프로덕션 환경의 정밀 제어 지원
- •Amazon HyperPod 또는 SageMaker 훈련 작업으로 학습된 모델의 원활한 배포 생태계 구축
AWS가 커스텀 Amazon Nova 모델에 대한 관리형 추론 지원을 시작하며 Amazon SageMaker AI 생태계를 한층 확장했다. 이번 업데이트는 모델 훈련과 실제 프로덕션 환경 사이의 간극을 효과적으로 메워주며, 기업들이 전문가급의 신뢰성을 바탕으로 특화된 Nova Micro 및 Nova Lite 버전을 유연하게 확장할 수 있게 돕는다. 이전에는 개발자들이 실험 단계에서 트래픽이 집중되는 실사용 단계로 전환할 때 운영상의 난관에 봉착하곤 했다. 하지만 이제는 자동화된 확장 기능과 최적화된 하드웨어를 활용해 AI 애플리케이션의 응답성과 비용 효율성을 동시에 확보할 수 있게 되었다.
특히 이번 통합 서비스는 비즈니스 운영에 필수적인 배포 파라미터에 대해 매우 세밀한 제어 기능을 제공한다. 사용자들은 이제 모델이 한 번에 처리하는 요청 수인 동시성 설정을 직접 조정할 수 있으며, 특정 문서 처리 요구사항에 맞춰 컨텍스트 길이를 수정하는 것도 가능하다. 또한 지도 미세 조정이나 강화 학습을 거친 모델까지 폭넓게 지원함에 따라, AWS는 전 세계 리전에서 특정 산업 분야에 특화된 지능형 모델을 효율적으로 서비스할 수 있는 기반을 마련했다.
무엇보다 이번 출시의 핵심은 운영 효율성에 있다. 사용 패턴에 실시간으로 반응하는 오토스케일링 정책과 다양한 NVIDIA GPU 인스턴스 지원을 통해, 기업들은 서비스 속도 저하 없이 유휴 자원을 최소화할 수 있다. 이와 같은 엔드 투 엔드 워크플로우는 현대 기업 환경에서 고도화된 추론 모델이 겪는 복잡한 생명주기를 대폭 단순화하고, 결과적으로 AI 도입 문턱을 낮추는 역할을 할 것으로 기대된다.