GPT-4o Mini Transcribeは、OpenAIの軽量な音声認識モデルで、GPT-4o Miniアーキテクチャを基盤としています。従来のWhisperモデルと比較して単語エラー率と言語認識精度が向上しており、低遅延・低コストで大量の文字起こし作業に適しています。WebSocketを通じたリアルタイム音声ストリーミングに対応し、コンテキストプロンプトを使って専門用語の文字起こし精度を高めることができます。
API|商用モデル
AI性能評価
出力速度
標準モード
53tok/s↓29
出力開始 0.49s