Grok 4.20 (Reasoning)은 xAI의 Grok 4.20의 추론 활성화 구성으로, 답변 제시 전 확장된 내부 사고 과정을 통해 문제를 풀어냅니다. 모델의 네이티브 다중 에이전트 구조 및 교차 검증과 결합하여, 깊은 논리, 수학적 추론, 복잡한 다단계 문제 해결이 필요한 작업에서 Grok 제품군 최고의 정확도를 달성합니다. 동일한 200만 토큰 컨텍스트 창, 엄격한 프롬프트 준수, 동급 최저 수준의 환각률을 지원합니다.
Grok SuperGrok HeavyAPI|비전심층 사고웹 검색파일|상용 모델
AI 성능 평가
Arena 종합 점수
1482
±6집계일 2026-04-23
종합 순위
8위
14,620 투표수
Arena 능력별 점수
한국어 능력
1470±37🥉 3위
복잡한 질문
1495±714위
전문 지식
1469±1839위
지시 이행
1455±921위
대화 기억
1491±1310위
창의력
1467±138위
코딩 실력
1513±1020위
수학 능력
1457±1825위
Arena 직군별 점수
문학·창작
1458±1112위
생활·사회과학
1487±1213위
엔터·미디어
1457±129위
경영·금융
1472±1213위
의학·보건
1517±194위
법률·행정
1502±186위
소프트웨어·IT
1511±813위
수학·통계
1459±2230위
종합
AA Intelligence Index
49%↑11%
LiveBench
69%↑9%
추론·수학
GPQA Diamond
91%↑10%
HLE
32%↑15%
LB 추론
75%↑16%
LB 수학
87%↑14%
LB 데이터 분석
63%↑13%
코딩
AA Coding Index
41%↑6%
LB 코딩
66%↓8%
LB 에이전틱
43%↑0%
TAU2
93%↑20%
TerminalBench
38%↑7%
SciCode
46%↑5%
언어·지시
IFBench
81%↑24%
AA-LCR
58%↓4%
LB 언어
78%↑6%
LB 지시
63%↑17%
출력 속도
일반 모드
113tok/s↑31
출력 시작 0.42s
추론 모드
110tok/s↑22
출력 시작 27.83s