GPT-4o Mini TTSは、OpenAIのコスト効率の高いテキスト読み上げモデルで、GPT-4o Miniアーキテクチャを基盤としています。書かれたテキストを自然で表現力豊かな音声に変換し、プロンプト内の自然言語指示によって声のトーン、ペース、強調などの音声特性を細かく制御できます。従来のOpenAI音声合成モデルと比較して単語エラー率が大幅に改善され、韻律もより自然になり、音声エージェント、アクセシビリティ機能、大規模な音声コンテンツ制作に最適です。
API|商用モデル
AI性能評価
言語·指示
幻覚率 (HHEM)
9.6%↓1%
事実一貫性 (HHEM)
90%↑1%