MiniMax
MiniMax

MiniMax M2.5

2026-02-12

MiniMax M2.5は、数十万の複雑な実世界環境で強化学習により訓練されたフロンティア言語モデルで、SWE-Bench Verified 80.2%、Multi-SWE-Bench 51.3%、BrowseComp 76.3%の最高水準のスコアを達成しています。M2.1のコーディング専門性を基盤に一般的なオフィス生産性まで拡張し、Word、Excel、PowerPointファイルの作成・操作、多様なソフトウェア環境間の切り替え、エージェントと人間のチーム間での協働が可能です。M2.1と比べて37%高速に評価を完了し、1時間あたり1ドルで連続実行できるほどコスト効率に優れています。

API|深い思考|公開モデルModified MIT
学習完了日
非公開
入力形式 → 出力形式
処理容量
197KIN66KOUT
単価(100万文字)
$0.15IN$1.15OUT
費用を計算する

AI性能評価

Arena 総合点数
1400
±5
集計日 2026-04-23
総合ランク
100位
21,236 投票数
Arena 能力別スコア
日本語能力
1209±58157位
複雑な質問
1425±691位
専門知識
1440±1571位
指示遂行
1396±892位
会話記憶
1408±1092位
創造力
1376±1094位
コード作成
1456±987位
数学力
1411±1581位
Arena 職種別スコア
文学·創作
1384±993位
生活·社会
1408±11107位
エンタメ
1382±1084位
経営·金融
1412±1083位
医学·保健
1405±16116位
法律·行政
1411±1694位
ソフト開発
1442±790位
数学·統計
1416±1883位
総合
AA Intelligence Index
42%↑4%
LiveBench
60%↑0%
推論·数学
GPQA Diamond
85%↑4%
HLE
19%↑2%
LB 推論
59%↑0%
LB 数学
77%↑4%
LB データ
50%↑0%
コーディング
AA Coding Index
37%↑3%
LB コード
71%↓3%
LB エージェント
52%↑8%
TAU2
95%↑22%
TerminalBench
35%↑4%
SciCode
43%↑2%
言語·指示
IFBench
72%↑15%
AA-LCR
66%↑4%
LB 言語
55%↓17%
LB 指示
57%↑11%
出力速度
標準モード
104tok/s↑22
出力開始 20.51s