OpenAI, 특화된 실시간 음성 모델 시리즈 출시
VentureBeat
2026년 5월 10일 (일)
- •OpenAI가 Realtime-2, Realtime-Translate, Realtime-Whisper 모델을 공개했다.
- •새로운 아키텍처는 음성 처리를 개별적이고 전문화된 작업으로 분할한다.
- •오케스트레이션 오버헤드를 줄여 기업용 음성 에이전트 도입 비용을 절감한다.
OpenAI가 AI 음성 에이전트의 역량을 강화하기 위해 Realtime-2, Realtime-Translate, Realtime-Whisper로 구성된 새로운 모델 제품군을 선보였다. 이전의 통합형 접근 방식과 달리, 이번 시스템은 음성 처리 과정을 세분화된 전문 모델들로 분리했다.
이러한 작업 분리를 통해 다양한 AI 구성 요소를 연결할 때 발생하는 복잡하고 자원 집약적인 작업인 오케스트레이션 오버헤드가 크게 감소했다. 그 결과, 기업 환경에서 음성 에이전트를 더욱 효율적이고 경제적으로 구축할 수 있게 됐다. 또한, 이번 업데이트에는 GPT-5급으로 평가받는 추론 능력이 포함되어 실시간 상호작용 중 더욱 복잡한 의사결정이 가능해졌다.