Gemini 2.5 Flash Lite는 Gemini 2.5 제품군의 경량 추론 모델로, 초저지연과 비용 효율에 최적화되어 있습니다. 이전 Flash 모델 대비 더 빠른 토큰 생성과 향상된 벤치마크 성능을 제공하며, 속도를 우선하기 위해 사고 기능이 기본적으로 비활성화되어 있습니다. 깊은 추론보다 빠른 응답이 중요한 대량 처리 작업에 맞게 설계되었으며, Gemini 2.5 제품군에서 가장 저렴한 진입점을 제공합니다.
API|비전심층 사고웹 검색파일|상용 모델
AI 성능 평가
Arena 종합 점수
1380
±4집계일 2026-04-23
종합 순위
126위
47,291 투표수
Arena 능력별 점수
한국어 능력
1344±2289위
복잡한 질문
1390±5133위
전문 지식
1386±12127위
지시 이행
1365±6132위
대화 기억
1374±7129위
창의력
1361±8109위
코딩 실력
1397±7149위
수학 능력
1364±11140위
Arena 직군별 점수
문학·창작
1371±6110위
생활·사회과학
1403±7119위
엔터·미디어
1346±7124위
경영·금융
1378±7124위
의학·보건
1399±12124위
법률·행정
1400±11116위
소프트웨어·IT
1400±5141위
수학·통계
1370±13135위
종합
AA Intelligence Index
19%↓19%
LiveBench
42%↓19%
ForecastBench
57%↓2%
추론·수학
AA Math Index
47%↓27%
GPQA Diamond
65%↓16%
HLE
4.6%↓13%
MMLU-Pro
80%↓2%
AIME 2025
47%↓27%
LB 추론
43%↓16%
LB 수학
61%↓13%
LB 데이터 분석
47%↓3%
코딩
AA Coding Index
15%↓20%
LiveCodeBench
64%↓1%
LB 코딩
66%↓7%
LB 에이전틱
5.0%↓38%
TAU2
30%↓43%
TerminalBench
7.6%↓23%
SciCode
28%↓12%
언어·지시
IFBench
42%↓15%
AA-LCR
48%↓14%
환각률 (HHEM)
3.3%↓7%
사실 일관성 (HHEM)
97%↑7%
LB 언어
52%↓20%
LB 지시
23%↓23%
출력 속도
일반 모드
105tok/s↑23
출력 시작 0.53s