OpenAI
OpenAI

GPT-4o Transcribe

2024-06-01

GPT-4o Transcribeは、OpenAIの高精度音声認識モデルで、GPT-4oアーキテクチャを基盤に最高水準の文字起こし精度を提供します。WhisperやGPT-4o Mini Transcribeと比較してさらに低い単語エラー率と優れた言語認識性能を備え、高い精度が求められる文字起こし作業に最適です。WebSocketを通じたリアルタイム音声ストリーミング、専門用語向けのコンテキストプロンプト、信頼度評価のための対数確率出力に対応しています。

API|商用モデル
学習完了日
2024-06-01
入力形式 → 出力形式
処理容量
単価(100万文字)
$2.5IN$10OUT
費用を計算する

AI性能評価

出力速度
標準モード
31tok/s↓51
出力開始 0.70s