Gemma 4 31B는 Google DeepMind의 가장 강력한 오픈 가중치 모델로, Apache 2.0 라이선스로 공개된 307억 매개변수의 조밀 멀티모달 모델입니다. 256K 토큰 컨텍스트 창에서 텍스트와 이미지 입력을 처리하며, 설정 가능한 사고/추론 모드, 네이티브 함수 호출, 구조화된 JSON 출력, 140개 이상의 언어를 지원합니다. Arena AI 리더보드에서 세계 오픈 모델 상위 3위에 올라 있으며, 수학, 코딩, 에이전트 도구 활용에서 Llama 4, Qwen 3.5 등 대형 모델에 견주는 성능을 발휘하고, 24GB 그래픽 메모리의 소비자용 GPU에서도 양자화 실행이 가능합니다.
API|비전심층 사고|공개 모델Apache 2.0
AI 성능 평가
Arena 종합 점수
1451
±8집계일 2026-04-23
종합 순위
32위
5,818 투표수
Arena 능력별 점수
복잡한 질문
1474±1036위
전문 지식
1482±2730위
지시 이행
1452±1425위
대화 기억
1461±1836위
창의력
1422±2037위
코딩 실력
1498±1635위
수학 능력
1468±2818위
Arena 직군별 점수
문학·창작
1432±1634위
생활·사회과학
1464±2039위
엔터·미디어
1415±1842위
경영·금융
1443±1743위
의학·보건
1464±2949위
법률·행정
1467±2728위
소프트웨어·IT
1490±1231위
수학·통계
1471±3118위
종합
AA Intelligence Index
39%↑1%
LiveBench
62%↑2%
추론·수학
GPQA Diamond
86%↑5%
HLE
23%↑6%
LB 추론
59%↑0%
LB 수학
74%↑0%
LB 데이터 분석
59%↑9%
코딩
AA Coding Index
39%↑5%
LB 코딩
60%↓13%
LB 에이전틱
40%↓3%
TAU2
60%↓13%
TerminalBench
36%↑5%
SciCode
43%↑3%
언어·지시
IFBench
76%↑19%
AA-LCR
62%↑0%
환각률 (HHEM)
7.4%↓3%
사실 일관성 (HHEM)
93%↑3%
LB 언어
71%↑0%
LB 지시
68%↑21%
출력 속도
일반 모드
14tok/s↓68
출력 시작 1.21s
추론 모드
35tok/s↓53
출력 시작 58.31s