Grok

Grok 4.20

Name: Grok Grok 4.20
Author: Grok

체험 비교

Model ID:grok-4.20-0309-non-reasoning

2026-03-09

체험 비교

Grok 4.20은 2026년 2월에 출시된 xAI의 최신 플래그십 모델로, 전문화된 4개의 AI 에이전트가 복잡한 질의에 동시에 협력하는 네이티브 다중 에이전트 구조를 도입했습니다. 서양 프론티어 모델 중 가장 큰 200만 토큰 컨텍스트 창을 유지하며, 에이전트 간 교차 검증을 통해 환각률을 65% 줄였습니다. 실제 사용 데이터를 기반으로 매주 성능을 갱신하며, 초당 232토큰, 첫 토큰 응답 시간 0.54초의 빠른 직접 응답을 제공합니다.

Grok SuperGrok HeavyAPI|상용 모델

학습 완료일

비공개

이 AI가 학습을 마친 날짜입니다. 이후 발생한 사건이나 정보는 알지 못할 수 있습니다.

입력 형식 → 출력 형식

이 AI에게 전달할 수 있는 정보 유형과, AI가 생성할 수 있는 결과물 유형을 나타냅니다.

처리용량

2MIN2MOUT

한 번의 요청에서 AI가 한꺼번에 읽고 처리할 수 있는 최대 분량입니다. 숫자가 클수록 긴 문서나 대화를 처리할 수 있습니다.

개별 비용(백만 글자)

$2IN$6OUT

이 AI를 직접 연동해 사용할 때 발생하는 비용입니다. 텍스트 100만 단위(토큰)당 달러 기준으로 표시됩니다.

비용 계산하기

출처:공식 문서 OpenRouter

AI 성능 평가

Arena 종합 점수

1482

±6

집계일 2026-04-23

종합 순위

8위

14,620 투표수

Arena 능력별 점수

한국어 능력

1470±37🥉 3위

복잡한 질문

1495±714위

전문 지식

1469±1839위

지시 이행

1455±921위

대화 기억

1491±1310위

창의력

1467±138위

코딩 실력

1513±1020위

수학 능력

1457±1825위

Arena 직군별 점수

문학·창작

1458±1112위

생활·사회과학

1487±1213위

엔터·미디어

1457±129위

경영·금융

1472±1213위

의학·보건

1517±194위

법률·행정

1502±186위

소프트웨어·IT

1511±813위

수학·통계

1459±2230위

출처:Arena Intelligence

종합

AA Intelligence Index

29%↓9%

LiveBench

38%↓22%

ForecastBench

62%↑3%

추론·수학

GPQA Diamond

78%↓3%

HLE

24%↑7%

LB 추론

26%↓34%

LB 수학

46%↓28%

LB 데이터 분석

43%↓6%

코딩

AA Coding Index

22%↓12%

LB 코딩

59%↓15%

LB 에이전틱

38%↓5%

TAU2

60%↓13%

TerminalBench

17%↓14%

SciCode

33%↓8%

언어·지시

IFBench

49%↓7%

AA-LCR

17%↓44%

LB 언어

42%↓30%

LB 지시

24%↓22%

출력 속도

일반 모드

107tok/s↑25

출력 시작 0.43s

추론 모드

248tok/s↑160

출력 시작 11.74s

출처:Artificial Analysis LiveBench ForecastBench

Grok