Z.ai
Z.ai

GLM-5.1

2026-04-07

GLM-5.1은 Z.ai가 2026년 4월 MIT 라이선스로 공개한 최신 오픈소스 모델로, 정교한 강화 학습을 통해 코딩 및 에이전트 성능을 목표로 GLM-5를 후훈련 업그레이드했습니다. 동일한 7,440억 MoE 구조(400억 활성 매개변수)와 200K 토큰 컨텍스트 창을 기반으로, SWE-Bench Pro에서 58.4%를 기록하여 Claude Opus 4.6(57.3%)을 넘어섰습니다. 사람의 개입 없이 최대 8시간 동안 계획-실행-테스트-수정-최적화의 전체 루프를 자율적으로 관리할 수 있어, 장기 에이전트형 엔지니어링 작업을 위한 가장 강력한 오픈 가중치 모델 중 하나입니다.

심층 사고|공개 모델MIT
학습 완료일
2025
입력 형식 → 출력 형식
처리용량
203KIN66KOUT
개별 비용(백만 글자)
$1.05IN$3.5OUT
비용 계산하기

AI 성능 평가

Arena 종합 점수
1470
±7
집계일 2026-04-23
종합 순위
15위
9,028 투표수
Arena 능력별 점수
한국어 능력
1411±4025위
복잡한 질문
1489±819위
전문 지식
1486±2125위
지시 이행
1460±1115위
대화 기억
1474±1621위
창의력
1451±1612위
코딩 실력
1520±1210위
수학 능력
1475±2412위
Arena 직군별 점수
문학·창작
1457±1315위
생활·사회과학
1490±1510위
엔터·미디어
1451±1513위
경영·금융
1455±1429위
의학·보건
1462±2350위
법률·행정
1476±2320위
소프트웨어·IT
1508±1015위
수학·통계
1476±2615위
종합
AA Intelligence Index
51%↑13%
LiveBench
71%↑10%
추론·수학
GPQA Diamond
87%↑6%
HLE
28%↑11%
LB 추론
73%↑13%
LB 수학
85%↑11%
LB 데이터 분석
63%↑14%
코딩
AA Coding Index
43%↑9%
LB 코딩
75%↑2%
LB 에이전틱
55%↑12%
TAU2
98%↑24%
TerminalBench
43%↑12%
SciCode
44%↑3%
언어·지시
IFBench
76%↑20%
AA-LCR
62%↑1%
환각률 (HHEM)
10%↑0%
사실 일관성 (HHEM)
90%↑0%
LB 언어
72%↑0%
LB 지시
68%↑22%
출력 속도
일반 모드
47tok/s↓35
출력 시작 1.30s
추론 모드
53tok/s↓35
출력 시작 72.52s