OpenAI
OpenAI

GPT-5

2025-08-07

GPT-5は、2025年半ばにリリースされたOpenAIの統合フロンティアモデルで、高度な推論、コーディング、マルチモーダル機能を一つのシステムに統合しました。設定可能な思考深度とテスト時の計算スケーリングを導入し、従来モデルと比較してハルシネーションや追従的な回答を大幅に削減しています。段階的な推論、指示追従、高精度な判断が求められる複雑な多段階タスクに優れ、コーディング、文章作成、事実に基づく信頼性で顕著な向上を示しています。

API|ビジョン深い思考ファイル|商用モデル
学習完了日
2024-09-30
入力形式 → 出力形式
処理容量
400KIN128KOUT
単価(100万文字)
$1.25IN$10OUT
費用を計算する

AI性能評価

Arena 総合点数
1434
±5
集計日 2026-04-23
総合ランク
54位
31,986 投票数
Arena 能力別スコア
日本語能力
1430±2317位
複雑な質問
1446±665位
専門知識
1459±1647位
指示遂行
1409±772位
会話記憶
1420±973位
創造力
1375±1096位
コード作成
1466±867位
数学力
1434±1446位
Arena 職種別スコア
文学·創作
1397±876位
生活·社会
1443±966位
エンタメ
1397±860位
経営·金融
1414±976位
医学·保健
1456±1556位
法律·行政
1455±1445位
ソフト開発
1452±778位
数学·統計
1441±1449位
総合
AA Intelligence Index
22%↓17%
LiveBench
71%↑11%
ForecastBench
61%↑2%
推論·数学
AA Math Index
48%↓25%
GPQA Diamond
69%↓12%
HLE
5.8%↓11%
MMLU-Pro
82%↑0%
AIME 2025
48%↓25%
LB 推論
82%↑22%
LB 数学
86%↑13%
LB データ
57%↑7%
コーディング
AA Coding Index
21%↓13%
LiveCodeBench
54%↓11%
LB コード
72%↓2%
LB エージェント
52%↑8%
TAU2
0.0%↓73%
TerminalBench
13%↓18%
SciCode
38%↓3%
言語·指示
IFBench
45%↓12%
AA-LCR
64%↑2%
幻覚率 (HHEM)
15%↑5%
事実一貫性 (HHEM)
85%↓5%
LB 言語
81%↑9%
LB 指示
64%↑18%
出力速度
標準モード
77tok/s↓5
出力開始 1.03s
推論モード
85tok/s↓3
出力開始 41.72s