OpenAI、特化型リアルタイム音声モデルを発表
VentureBeat
2026年5月10日 (日)
- •OpenAIがRealtime-2、Realtime-Translate、Realtime-Whisperモデルを公開
- •新しいアーキテクチャで音声処理を個別のタスクに分割
- •オーケストレーションのオーバーヘッド低減により、企業向け音声エージェントの導入コストを削減
OpenAIは、AI音声エージェントの能力を強化するために設計された新しいモデル群「Realtime-2」「Realtime-Translate」「Realtime-Whisper」を発表した。従来の統合的なアプローチとは異なり、このシステムは音声処理を個別の特化型モデルへと分割している。
これらのタスクを分離することで、異なるAIコンポーネントを連携させる際に生じるリソース集約的で複雑な調整作業、すなわちオーケストレーションのオーバーヘッドが劇的に低減された。これにより、企業環境における音声エージェントの導入効率とコスト対効果が向上する。また、今回のアップデートにはGPT-5クラスと称される推論能力が組み込まれており、リアルタイムの対話中に高度な意思決定を行うことが可能となった。