Grok

Grok 4.20 (Reasoning)

Name: Grok Grok 4.20 (Reasoning)
Author: Grok

비교

Model ID:grok-4.20-0309-reasoning

2026-03-31

비교

Grok 4.20 (Reasoning)은 xAI의 Grok 4.20의 추론 활성화 구성으로, 답변 제시 전 확장된 내부 사고 과정을 통해 문제를 풀어냅니다. 모델의 네이티브 다중 에이전트 구조 및 교차 검증과 결합하여, 깊은 논리, 수학적 추론, 복잡한 다단계 문제 해결이 필요한 작업에서 Grok 제품군 최고의 정확도를 달성합니다. 동일한 200만 토큰 컨텍스트 창, 엄격한 프롬프트 준수, 동급 최저 수준의 환각률을 지원합니다.

Grok SuperGrok HeavyAPI|비전심층 사고웹 검색파일|상용 모델

학습 완료일

비공개

이 AI가 학습을 마친 날짜입니다. 이후 발생한 사건이나 정보는 알지 못할 수 있습니다.

입력 형식 → 출력 형식

이 AI에게 전달할 수 있는 정보 유형과, AI가 생성할 수 있는 결과물 유형을 나타냅니다.

처리용량

2MIN2MOUT

한 번의 요청에서 AI가 한꺼번에 읽고 처리할 수 있는 최대 분량입니다. 숫자가 클수록 긴 문서나 대화를 처리할 수 있습니다.

개별 비용(백만 글자)

$2IN$6OUT

이 AI를 직접 연동해 사용할 때 발생하는 비용입니다. 텍스트 100만 단위(토큰)당 달러 기준으로 표시됩니다.

비용 계산하기

출처:공식 문서 OpenRouter

AI 성능 평가

Arena 종합 점수

1482

±6

집계일 2026-04-23

종합 순위

8위

14,620 투표수

Arena 능력별 점수

한국어 능력

1470±37🥉 3위

복잡한 질문

1495±714위

전문 지식

1469±1839위

지시 이행

1455±921위

대화 기억

1491±1310위

창의력

1467±138위

코딩 실력

1513±1020위

수학 능력

1457±1825위

Arena 직군별 점수

문학·창작

1458±1112위

생활·사회과학

1487±1213위

엔터·미디어

1457±129위

경영·금융

1472±1213위

의학·보건

1517±194위

법률·행정

1502±186위

소프트웨어·IT

1511±813위

수학·통계

1459±2230위

출처:Arena Intelligence

종합

AA Intelligence Index

49%↑11%

LiveBench

69%↑9%

추론·수학

GPQA Diamond

91%↑10%

HLE

32%↑15%

LB 추론

75%↑16%

LB 수학

87%↑14%

LB 데이터 분석

63%↑13%

코딩

AA Coding Index

41%↑6%

LB 코딩

66%↓8%

LB 에이전틱

43%↑0%

TAU2

93%↑20%

TerminalBench

38%↑7%

SciCode

46%↑5%

언어·지시

IFBench

81%↑24%

AA-LCR

58%↓4%

LB 언어

78%↑6%

LB 지시

63%↑17%

출력 속도

일반 모드

113tok/s↑31

출력 시작 0.42s

추론 모드

110tok/s↑22

출력 시작 27.83s

출처:Artificial Analysis LiveBench

Grok