OpenAI

GPT-5.4

Name: OpenAI GPT-5.4
Author: OpenAI

比較

Model ID:gpt-5.4-2026-03-05

2026-03-05

比較

GPT-5.4は、2026年3月にリリースされたOpenAIの最新フロンティアモデルで、CodexとGPT製品ラインを単一のシステムに統合しました。100万トークン以上のコンテキストウィンドウ、ネイティブのコンピュータ操作機能、GPT-5.3-Codexから継承した最高水準のコーディング性能を備えています。GPT-5.2と比較してトークン効率が大幅に向上し、44職種にわたる知識作業ベンチマークで専門家と83%同等以上の成果を達成しています。エージェント型コーディング、ドキュメント理解、ツール活用、複雑な多段階ワークフローに優れています。

OpenAI PlusOpenAI ProAPI|ビジョン深い思考Web検索ファイル|商用モデル

学習完了日

2025-08-31

このAIが学習を終えた日付です。それ以降に起きた出来事や情報は知らない場合があります。

入力形式 → 出力形式

このAIに渡せる情報の種類と、AIが生成できる結果の種類を示しています。

処理容量

1.1MIN128KOUT

1回のリクエストでAIが一度に読んで処理できる最大量です。数値が大きいほど、長い文書や会話を扱えます。

単価（100万文字）

$2.5IN$15OUT

このAIを直接連携して使用する際にかかる費用です。テキスト100万単位（トークン）あたりのドル換算で表示されます。

費用を計算する

出典:公式ドキュメント OpenAI GPT-5 Blog LMSYS Chatbot Arena OpenRouter

AI性能評価

Arena 総合点数

1481

±6

集計日 2026-04-23

総合ランク

9位

13,593 投票数

Arena 能力別スコア

複雑な質問

1503±78位

専門知識

1526±195位

指示遂行

1481±107位

会話記憶

1497±128位

創造力

1448±1415位

コード作成

1532±116位

数学力

1515±20🥈 2位

Arena 職種別スコア

文学·創作

1470±117位

生活·社会

1479±1324位

エンタメ

1448±1314位

経営·金融

1477±1210位

医学·保健

1475±2032位

法律·行政

1471±1925位

ソフト開発

1513±99位

数学·統計

1516±22🥉 3位

出典:Arena Intelligence

総合

AA Intelligence Index

57%↑18%

LiveBench

81%↑21%

ForecastBench

58%↓1%

推論·数学

GPQA Diamond

92%↑11%

HLE

42%↑25%

LB 推論

88%↑28%

LB 数学

94%↑21%

LB データ

79%↑30%

コーディング

AA Coding Index

57%↑23%

LB コード

78%↑4%

LB エージェント

70%↑27%

TAU2

87%↑14%

TerminalBench

58%↑26%

SciCode

57%↑16%

言語·指示

IFBench

74%↑17%

AA-LCR

74%↑12%

幻覚率 (HHEM)

7.0%↓3%

事実一貫性 (HHEM)

93%↑3%

LB 言語

83%↑11%

LB 指示

70%↑24%

出力速度

標準モード

155tok/s↑73

出力開始 0.55s

推論モード

152tok/s↑64

出力開始 7.32s

出典:Artificial Analysis LiveBench ForecastBench Vectara HHEM

多言語能力

MGSM 🇰🇷

94%

MGSM 🇯🇵

92%

KMMLU 🇰🇷

77%

JMMLU 🇯🇵

75%

OpenAI