OpenAI

GPT-4.1

Name: OpenAI GPT-4.1
Author: OpenAI

比較

Model ID:gpt-4.1-2025-04-14

2025-04-14

比較

GPT-4.1は、2025年4月にリリースされたOpenAIのフラッグシップ言語モデルで、コーディング、指示追従、長文コンテキスト推論に最適化されています。GPT-4oの8倍以上となる100万トークンのコンテキストウィンドウに対応し、SWE-bench Verifiedで54.6%を達成して実際のソフトウェアエンジニアリングタスクで大幅な性能向上を示しました。正確なコード差分生成、エージェントの安定性、大規模ドキュメントからの高い情報検出に優れ、IDE連携ツール、自動コーディングエージェント、企業向け知識検索に適しています。

API|ビジョンWeb検索ファイル|商用モデル

学習完了日

2024-06-30

このAIが学習を終えた日付です。それ以降に起きた出来事や情報は知らない場合があります。

入力形式 → 出力形式

このAIに渡せる情報の種類と、AIが生成できる結果の種類を示しています。

処理容量

1.0MIN33KOUT

1回のリクエストでAIが一度に読んで処理できる最大量です。数値が大きいほど、長い文書や会話を扱えます。

単価（100万文字）

$2IN$8OUT

このAIを直接連携して使用する際にかかる費用です。テキスト100万単位（トークン）あたりのドル換算で表示されます。

費用を計算する

出典:公式ドキュメント OpenRouter

AI性能評価

Arena 総合点数

1312

±4

集計日 2026-04-23

総合ランク

207位

100,105 投票数

Arena 能力別スコア

日本語能力

1263±18119位

複雑な質問

1311±6213位

専門知識

1286±12206位

指示遂行

1294±6205位

会話記憶

1298±8206位

創造力

1285±8194位

コード作成

1338±7214位

数学力

1303±8184位

Arena 職種別スコア

文学·創作

1306±6188位

生活·社会

1321±8211位

エンタメ

1290±8182位

経営·金融

1282±9226位

医学·保健

1305±12212位

法律·行政

1317±11215位

ソフト開発

1324±6221位

数学·統計

1308±8186位

出典:Arena Intelligence

総合

AA Intelligence Index

26%↓12%

ForecastBench

59%↑0%

推論·数学

AA Math Index

35%↓39%

GPQA Diamond

67%↓14%

HLE

4.6%↓13%

MMLU-Pro

81%↓1%

AIME 2025

35%↓39%

MATH-500

91%↓2%

コーディング

AA Coding Index

22%↓12%

LiveCodeBench

46%↓20%

TAU2

47%↓26%

TerminalBench

14%↓17%

SciCode

38%↓3%

言語·指示

IFBench

43%↓14%

AA-LCR

61%↓1%

幻覚率 (HHEM)

5.6%↓5%

事実一貫性 (HHEM)

94%↑4%

出力速度

標準モード

103tok/s↑21

出力開始 0.58s

出典:Artificial Analysis ForecastBench Vectara HHEM

OpenAI