AIモデル比較 | aib vote

わたしたちの信念

GPT Audioは、OpenAIのマルチモーダル音声モデルで、チャット補完APIを通じて音声対音声のやり取りをネイティブに対応します。音声認識と音声合成を別々のモデルで繋げる従来のパイプラインとは異なり、単一のモデルで音声を直接処理・生成するため、低遅延で自然な音声を出力し、声のトーンや感情といった微妙なニュアンスも的確に再現します。

提供元

OpenAI

OpenAI

リリース日

2025-08-28

学習完了日

2023-10-01

ライセンス

商用モデル

入出力形式

コンテキスト長

128K / 16K

API入出力 (1M)

$2.5 / $10

利用方法

—

出力速度

—

Arena 総合

—

Intelligence Index

—

Coding Index

—

Math Index

—

LiveBench

—

ForecastBench

—

GPQA Diamond

—

HLE

—

MMLU-Pro

—

AIME 2025

—

MATH-500

—

LB 推論

—

LB 数学

—

LB データ分析

—

LiveCodeBench

—

LB コーディング

—

LB エージェンティック

—

TAU2

—

TerminalBench

—

SciCode

—

IFBench

—

AA-LCR

—

幻覚率 (HHEM)

—

事実一貫性 (HHEM)

—

LB 言語

—

LB 指示

—

コスト計算 AIモデル詳細ページ

1 / 3

左右にスワイプ

GPT Audioは、OpenAIのマルチモーダル音声モデルで、チャット補完APIを通じて音声対音声のやり取りをネイティブに対応します。音声認識と音声合成を別々のモデルで繋げる従来のパイプラインとは異なり、単一のモデルで音声を直接処理・生成するため、低遅延で自然な音声を出力し、声のトーンや感情といった微妙なニュアンスも的確に再現します。

提供元

OpenAI

OpenAI

リリース日

2025-08-28

学習完了日

2023-10-01

ライセンス

商用モデル

入出力形式

コンテキスト長

128K / 16K

API入出力 (1M)

$2.5 / $10

利用方法

—

出力速度

—

Arena 総合

—

Intelligence Index

—

Coding Index

—

Math Index

—

LiveBench

—

ForecastBench

—

GPQA Diamond

—

HLE

—

MMLU-Pro

—

AIME 2025

—

MATH-500

—

LB 推論

—

LB 数学

—

LB データ分析

—

LiveCodeBench

—

LB コーディング

—

LB エージェンティック

—

TAU2

—

TerminalBench

—

SciCode

—

IFBench

—

AA-LCR

—

幻覚率 (HHEM)

—

事実一貫性 (HHEM)

—

LB 言語

—

LB 指示

—

コスト計算 AIモデル詳細ページ