Grok
Grok

Grok 4.20

2026-03-09

Grok 4.20은 2026년 2월에 출시된 xAI의 최신 플래그십 모델로, 전문화된 4개의 AI 에이전트가 복잡한 질의에 동시에 협력하는 네이티브 다중 에이전트 구조를 도입했습니다. 서양 프론티어 모델 중 가장 큰 200만 토큰 컨텍스트 창을 유지하며, 에이전트 간 교차 검증을 통해 환각률을 65% 줄였습니다. 실제 사용 데이터를 기반으로 매주 성능을 갱신하며, 초당 232토큰, 첫 토큰 응답 시간 0.54초의 빠른 직접 응답을 제공합니다.

Grok SuperGrok HeavyAPI|상용 모델
학습 완료일
비공개
입력 형식 → 출력 형식
처리용량
2MIN2MOUT
개별 비용(백만 글자)
$2IN$6OUT
비용 계산하기

AI 성능 평가

Arena 종합 점수
1482
±6
집계일 2026-04-23
종합 순위
8위
14,620 투표수
Arena 능력별 점수
한국어 능력
1470±37🥉 3위
복잡한 질문
1495±714위
전문 지식
1469±1839위
지시 이행
1455±921위
대화 기억
1491±1310위
창의력
1467±138위
코딩 실력
1513±1020위
수학 능력
1457±1825위
Arena 직군별 점수
문학·창작
1458±1112위
생활·사회과학
1487±1213위
엔터·미디어
1457±129위
경영·금융
1472±1213위
의학·보건
1517±194위
법률·행정
1502±186위
소프트웨어·IT
1511±813위
수학·통계
1459±2230위
종합
AA Intelligence Index
29%↓9%
LiveBench
38%↓22%
ForecastBench
62%↑3%
추론·수학
GPQA Diamond
78%↓3%
HLE
24%↑7%
LB 추론
26%↓34%
LB 수학
46%↓28%
LB 데이터 분석
43%↓6%
코딩
AA Coding Index
22%↓12%
LB 코딩
59%↓15%
LB 에이전틱
38%↓5%
TAU2
60%↓13%
TerminalBench
17%↓14%
SciCode
33%↓8%
언어·지시
IFBench
49%↓7%
AA-LCR
17%↓44%
LB 언어
42%↓30%
LB 지시
24%↓22%
출력 속도
일반 모드
107tok/s↑25
출력 시작 0.43s
추론 모드
248tok/s↑160
출력 시작 11.74s