Google
Google

Gemini 2.5 Pro

2025-06-17

Gemini 2.5 Proは、Googleの最先端推論モデルで、深い分析的思考が求められる高度なコーディング、数学、科学タスク向けに設計されています。組み込みの「思考」機能により複雑な問題を段階的に高い精度で推論し、リリース時にLMArenaリーダーボードで1位を獲得して人間の選好との最高水準の整合性を実証しました。100万トークンのコンテキストウィンドウとマルチモーダル入力に対応し、複雑な問題解決、長文ドキュメント分析、最高水準の推論深度が求められる研究レベルのワークフローに優れています。

API|ビジョン深い思考Web検索ファイル|商用モデル
学習完了日
2025-01-31
入力形式 → 出力形式
処理容量
1.0MIN66KOUT
単価(100万文字)
$1.25IN$10OUT
費用を計算する

AI性能評価

Arena 総合点数
1448
±3
集計日 2026-04-23
総合ランク
38位
111,209 投票数
Arena 能力別スコア
日本語能力
1453±178位
複雑な質問
1460±348位
専門知識
1464±843位
指示遂行
1442±434位
会話記憶
1451±542位
創造力
1447±618位
コード作成
1466±569位
数学力
1444±737位
Arena 職種別スコア
文学·創作
1448±521位
生活·社会
1473±527位
エンタメ
1433±525位
経営·金融
1437±550位
医学·保健
1468±841位
法律·行政
1467±727位
ソフト開発
1461±460位
数学·統計
1450±835位
総合
AA Intelligence Index
35%↓4%
LiveBench
57%↓3%
ForecastBench
60%↑1%
推論·数学
AA Math Index
88%↑14%
GPQA Diamond
84%↑3%
HLE
21%↑4%
MMLU-Pro
86%↑4%
AIME 2025
88%↑14%
MATH-500
97%↑4%
LB 推論
71%↑11%
LB 数学
68%↓5%
LB データ
52%↑2%
コーディング
AA Coding Index
32%↓2%
LiveCodeBench
80%↑15%
LB コード
76%↑2%
LB エージェント
33%↓10%
TAU2
54%↓19%
TerminalBench
27%↓5%
SciCode
43%↑2%
言語·指示
IFBench
49%↓8%
AA-LCR
66%↑4%
幻覚率 (HHEM)
7.0%↓3%
事実一貫性 (HHEM)
93%↑3%
LB 言語
76%↑4%
LB 指示
33%↓13%
出力速度
標準モード
131tok/s↑49
出力開始 19.49s