GLM-5.1 is Z.ai's latest open-source model released in April 2026 under the MIT license, a post-training upgrade to GLM-5 targeting coding and agentic performance through refined reinforcement learning. Built on the same 744B MoE architecture with 40B active parameters and a 200K-token context window, it scores 58.4% on SWE-Bench Pro — surpassing Claude Opus 4.6 (57.3%) — and can autonomously manage a full plan-execute-test-fix-optimize loop for up to eight hours without human intervention. It represents one of the strongest open-weight models available for long-horizon agentic engineering tasks.
심층 사고|공개 모델MIT
AI 성능 평가
Arena 종합 점수
1470
±7집계일 2026-04-23
종합 순위
No.15
9,028 투표수
Arena 능력별 점수
복잡한 질문
1489±8No.19
전문 지식
1486±21No.25
지시 이행
1460±11No.15
대화 기억
1474±16No.21
창의력
1451±16No.12
코딩 실력
1520±12No.10
수학 능력
1475±24No.12
Arena 직군별 점수
문학·창작
1457±13No.15
생활·사회과학
1490±15No.10
엔터·미디어
1451±15No.13
경영·금융
1455±14No.29
의학·보건
1462±23No.50
법률·행정
1476±23No.20
소프트웨어·IT
1508±10No.15
수학·통계
1476±26No.15
종합
AA Intelligence Index
51%↑13%
LiveBench
71%↑10%
추론·수학
GPQA Diamond
87%↑6%
HLE
28%↑11%
LB Reasoning
73%↑13%
LB Math
85%↑11%
LB Data
63%↑14%
코딩
AA Coding Index
43%↑9%
LB Coding
75%↑2%
LB Agentic
55%↑12%
TAU2
98%↑24%
TerminalBench
43%↑12%
SciCode
44%↑3%
언어·지시
IFBench
76%↑20%
AA-LCR
62%↑1%
Hallucination (HHEM)
10%↑0%
Factual (HHEM)
90%↑0%
LB Language
72%↑0%
LB IF
68%↑22%
출력 속도
일반 모드
47tok/s↓35
출력 시작 1.30s
추론 모드
53tok/s↓35
출력 시작 72.52s