1 / 3
左右にスワイプ

GPT Audioは、OpenAIのマルチモーダル音声モデルで、チャット補完APIを通じて音声対音声のやり取りをネイティブに対応します。音声認識と音声合成を別々のモデルで繋げる従来のパイプラインとは異なり、単一のモデルで音声を直接処理・生成するため、低遅延で自然な音声を出力し、声のトーンや感情といった微妙なニュアンスも的確に再現します。

提供元
OpenAIOpenAI
リリース日
2025-08-28
学習完了日
2023-10-01
ライセンス
商用モデル
入出力形式
コンテキスト長
128K / 16K
API入出力 (1M)
$2.5 / $10
利用方法
出力速度
Arena 総合
Intelligence Index
Coding Index
Math Index
LiveBench
ForecastBench
GPQA Diamond
HLE
MMLU-Pro
AIME 2025
MATH-500
LB 推論
LB 数学
LB データ分析
LiveCodeBench
LB コーディング
LB エージェンティック
TAU2
TerminalBench
SciCode
IFBench
AA-LCR
幻覚率 (HHEM)
事実一貫性 (HHEM)
LB 言語
LB 指示