OpenAI
OpenAI

GPT-5.4

2026-03-05

GPT-5.4は、2026年3月にリリースされたOpenAIの最新フロンティアモデルで、CodexとGPT製品ラインを単一のシステムに統合しました。100万トークン以上のコンテキストウィンドウ、ネイティブのコンピュータ操作機能、GPT-5.3-Codexから継承した最高水準のコーディング性能を備えています。GPT-5.2と比較してトークン効率が大幅に向上し、44職種にわたる知識作業ベンチマークで専門家と83%同等以上の成果を達成しています。エージェント型コーディング、ドキュメント理解、ツール活用、複雑な多段階ワークフローに優れています。

OpenAI PlusOpenAI ProAPI|ビジョン深い思考Web検索ファイル|商用モデル
学習完了日
2025-08-31
入力形式 → 出力形式
処理容量
1.1MIN128KOUT
単価(100万文字)
$2.5IN$15OUT
費用を計算する

AI性能評価

Arena 総合点数
1481
±6
集計日 2026-04-23
総合ランク
9位
13,593 投票数
Arena 能力別スコア
複雑な質問
1503±78位
専門知識
1526±195位
指示遂行
1481±107位
会話記憶
1497±128位
創造力
1448±1415位
コード作成
1532±116位
数学力
1515±20🥈 2位
Arena 職種別スコア
文学·創作
1470±117位
生活·社会
1479±1324位
エンタメ
1448±1314位
経営·金融
1477±1210位
医学·保健
1475±2032位
法律·行政
1471±1925位
ソフト開発
1513±99位
数学·統計
1516±22🥉 3位
総合
AA Intelligence Index
57%↑18%
LiveBench
81%↑21%
ForecastBench
58%↓1%
推論·数学
GPQA Diamond
92%↑11%
HLE
42%↑25%
LB 推論
88%↑28%
LB 数学
94%↑21%
LB データ
79%↑30%
コーディング
AA Coding Index
57%↑23%
LB コード
78%↑4%
LB エージェント
70%↑27%
TAU2
87%↑14%
TerminalBench
58%↑26%
SciCode
57%↑16%
言語·指示
IFBench
74%↑17%
AA-LCR
74%↑12%
幻覚率 (HHEM)
7.0%↓3%
事実一貫性 (HHEM)
93%↑3%
LB 言語
83%↑11%
LB 指示
70%↑24%
出力速度
標準モード
155tok/s↑73
出力開始 0.55s
推論モード
152tok/s↑64
出力開始 7.32s

多言語能力

MGSM 🇰🇷
94%
MGSM 🇯🇵
92%
KMMLU 🇰🇷
77%
JMMLU 🇯🇵
75%