GLM-5.1は、Z.aiが2026年4月にMITライセンスで公開した最新のオープンソースモデルで、精緻な強化学習によるコーディングとエージェント性能の向上を目指してGLM-5をポストトレーニングアップグレードしたものです。同じ7,440億MoEアーキテクチャ(400億活性パラメータ)と200Kトークンのコンテキストウィンドウを基盤に、SWE-Bench Proで58.4%を記録しClaude Opus 4.6(57.3%)を上回りました。人間の介入なしに最大8時間にわたって計画・実行・テスト・修正・最適化の全ループを自律的に管理でき、長期エージェント型エンジニアリングタスク向けの最も強力なオープンウェイトモデルの一つです。
심층 사고|공개 모델MIT
AI 성능 평가
Arena 종합 점수
1470
±7집계일 2026-04-23
종합 순위
15位
9,028 투표수
Arena 능력별 점수
복잡한 질문
1489±819位
전문 지식
1486±2125位
지시 이행
1460±1115位
대화 기억
1474±1621位
창의력
1451±1612位
코딩 실력
1520±1210位
수학 능력
1475±2412位
Arena 직군별 점수
문학·창작
1457±1315位
생활·사회과학
1490±1510位
엔터·미디어
1451±1513位
경영·금융
1455±1429位
의학·보건
1462±2350位
법률·행정
1476±2320位
소프트웨어·IT
1508±1015位
수학·통계
1476±2615位
종합
AA Intelligence Index
51%↑13%
LiveBench
71%↑10%
추론·수학
GPQA Diamond
87%↑6%
HLE
28%↑11%
LB 推論
73%↑13%
LB 数学
85%↑11%
LB データ
63%↑14%
코딩
AA Coding Index
43%↑9%
LB コード
75%↑2%
LB エージェント
55%↑12%
TAU2
98%↑24%
TerminalBench
43%↑12%
SciCode
44%↑3%
언어·지시
IFBench
76%↑20%
AA-LCR
62%↑1%
幻覚率 (HHEM)
10%↑0%
事実一貫性 (HHEM)
90%↑0%
LB 言語
72%↑0%
LB 指示
68%↑22%
출력 속도
일반 모드
47tok/s↓35
출력 시작 1.30s
추론 모드
53tok/s↓35
출력 시작 72.52s