Gemini 2.5 Flash는 Google의 주력 추론 모델로, 코딩, 수학, 과학 작업에서 빠르고 높은 품질의 응답을 제공합니다. 설정 가능한 사고 수준을 갖춘 내장 "사고" 기능으로 작업 복잡도에 따라 응답 속도와 추론 깊이를 유연하게 조절할 수 있습니다. 텍스트, 이미지, 오디오, 동영상, PDF를 포함한 멀티모달 입력과 100만 토큰 컨텍스트 창을 지원하며, 대형 Gemini Pro 모델의 일부 비용과 지연 시간으로 뛰어난 성능을 제공합니다.
API|비전심층 사고웹 검색파일|상용 모델
AI 성능 평가
Arena 종합 점수
1411
±3집계일 2026-04-23
종합 순위
87위
110,831 투표수
Arena 능력별 점수
한국어 능력
1379±1551위
복잡한 질문
1420±399위
전문 지식
1427±887위
지시 이행
1403±481위
대화 기억
1404±5100위
창의력
1398±561위
코딩 실력
1424±5129위
수학 능력
1408±788위
Arena 직군별 점수
문학·창작
1405±464위
생활·사회과학
1430±584위
엔터·미디어
1390±575위
경영·금융
1398±5103위
의학·보건
1426±899위
법률·행정
1428±772위
소프트웨어·IT
1422±4117위
수학·통계
1420±877위
종합
AA Intelligence Index
27%↓11%
LiveBench
47%↓13%
ForecastBench
59%↓1%
추론·수학
AA Math Index
73%↑0%
GPQA Diamond
79%↓2%
HLE
11%↓6%
MMLU-Pro
83%↑1%
AIME 2025
73%↑0%
MATH-500
98%↑5%
LB 추론
45%↓15%
LB 수학
69%↓5%
LB 데이터 분석
47%↓2%
코딩
AA Coding Index
22%↓12%
LiveCodeBench
70%↑4%
LB 코딩
66%↓8%
LB 에이전틱
17%↓27%
TAU2
32%↓42%
TerminalBench
14%↓17%
SciCode
39%↓1%
언어·지시
IFBench
50%↓6%
AA-LCR
62%↑0%
환각률 (HHEM)
7.8%↓2%
사실 일관성 (HHEM)
92%↑2%
LB 언어
62%↓10%
LB 지시
29%↓18%
출력 속도
일반 모드
213tok/s↑131
출력 시작 0.44s
추론 모드
211tok/s↑123
출력 시작 12.83s