Google
Google

Gemini 2.5 Pro

2025-06-17

Gemini 2.5 Pro는 Google의 최첨단 추론 모델로, 깊은 분석적 사고가 요구되는 고급 코딩, 수학, 과학 작업에 맞게 설계되었습니다. 내장된 "사고" 기능으로 복잡한 문제를 단계별로 높은 정확도로 추론하며, 출시 시 LMArena 리더보드에서 1위를 달성하여 인간 선호도 정합에서 최고 수준을 입증했습니다. 100만 토큰 컨텍스트 창과 멀티모달 입력을 지원하여 복잡한 문제 해결, 장문 문서 분석, 최고 수준의 추론 깊이가 필요한 연구급 워크플로에 뛰어납니다.

API|비전심층 사고웹 검색파일|상용 모델
학습 완료일
2025-01-31
입력 형식 → 출력 형식
처리용량
1.0MIN66KOUT
개별 비용(백만 글자)
$1.25IN$10OUT
비용 계산하기

AI 성능 평가

Arena 종합 점수
1448
±3
집계일 2026-04-23
종합 순위
38위
111,209 투표수
Arena 능력별 점수
한국어 능력
1414±1421위
복잡한 질문
1460±348위
전문 지식
1464±843위
지시 이행
1442±434위
대화 기억
1451±542위
창의력
1447±618위
코딩 실력
1466±569위
수학 능력
1444±737위
Arena 직군별 점수
문학·창작
1448±521위
생활·사회과학
1473±527위
엔터·미디어
1433±525위
경영·금융
1437±550위
의학·보건
1468±841위
법률·행정
1467±727위
소프트웨어·IT
1461±460위
수학·통계
1450±835위
종합
AA Intelligence Index
35%↓4%
LiveBench
57%↓3%
ForecastBench
60%↑1%
추론·수학
AA Math Index
88%↑14%
GPQA Diamond
84%↑3%
HLE
21%↑4%
MMLU-Pro
86%↑4%
AIME 2025
88%↑14%
MATH-500
97%↑4%
LB 추론
71%↑11%
LB 수학
68%↓5%
LB 데이터 분석
52%↑2%
코딩
AA Coding Index
32%↓2%
LiveCodeBench
80%↑15%
LB 코딩
76%↑2%
LB 에이전틱
33%↓10%
TAU2
54%↓19%
TerminalBench
27%↓5%
SciCode
43%↑2%
언어·지시
IFBench
49%↓8%
AA-LCR
66%↑4%
환각률 (HHEM)
7.0%↓3%
사실 일관성 (HHEM)
93%↑3%
LB 언어
76%↑4%
LB 지시
33%↓13%
출력 속도
일반 모드
131tok/s↑49
출력 시작 19.49s