Anthropic

Claude Opus 4

Name: Anthropic Claude Opus 4
Author: Anthropic

比較

Model ID:claude-opus-4-20250514

2025-05-22

比較

Claude Opus 4は、2025年5月にリリースされたAnthropicの画期的なコーディング・エージェントモデルで、複雑な長時間タスクにおける持続的な性能で新たな基準を打ち立てました。SWE-bench（72.5%）とTerminal-bench（43.2%）でトップを記録し、数千ステップにわたるエージェントワークフローを性能低下なく数時間にわたって連続処理できます。ハイブリッドモデルとして即座の応答と深い推論のための拡張思考モードの両方に対応し、並列ツール使用と向上した指示記憶能力を備えています。

API|ビジョン深い思考Web検索ファイル|商用モデル

学習完了日

2025-05-01

このAIが学習を終えた日付です。それ以降に起きた出来事や情報は知らない場合があります。

入力形式 → 出力形式

このAIに渡せる情報の種類と、AIが生成できる結果の種類を示しています。

処理容量

1MIN128KOUT

1回のリクエストでAIが一度に読んで処理できる最大量です。数値が大きいほど、長い文書や会話を扱えます。

単価（100万文字）

$15IN$75OUT

このAIを直接連携して使用する際にかかる費用です。テキスト100万単位（トークン）あたりのドル換算で表示されます。

費用を計算する

出典:公式ドキュメント OpenRouter

AI性能評価

Arena 総合点数

1424

±4

集計日 2026-04-23

総合ランク

66位

36,951 投票数

Arena 能力別スコア

日本語能力

1387±2336位

複雑な質問

1455±653位

専門知識

1446±1466位

指示遂行

1442±733位

会話記憶

1437±855位

創造力

1429±933位

コード作成

1498±836位

数学力

1419±1270位

Arena 職種別スコア

文学·創作

1429±737位

生活·社会

1439±870位

エンタメ

1420±839位

経営·金融

1412±882位

医学·保健

1446±1369位

法律·行政

1436±1265位

ソフト開発

1466±653位

数学·統計

1424±1368位

出典:Arena Intelligence

総合

AA Intelligence Index

39%↑1%

ForecastBench

61%↑2%

推論·数学

AA Math Index

73%↑0%

GPQA Diamond

80%↓1%

HLE

12%↓5%

MMLU-Pro

87%↑5%

AIME 2025

73%↑0%

MATH-500

98%↑5%

コーディング

AA Coding Index

34%↑0%

LiveCodeBench

64%↓2%

TAU2

73%↑0%

TerminalBench

31%↑0%

SciCode

40%↓1%

言語·指示

IFBench

54%↓3%

AA-LCR

34%↓28%

幻覚率 (HHEM)

12%↑2%

事実一貫性 (HHEM)

88%↓2%

出力速度

標準モード

34tok/s↓48

出力開始 1.33s

推論モード

48tok/s↓40

出力開始 7.45s

出典:Artificial Analysis ForecastBench Vectara HHEM

Anthropic