Z.ai

GLM-5.1

Name: Z.ai GLM-5.1
Author: Z.ai

체험 비교

2026-04-07

체험 비교

GLM-5.1은 Z.ai가 2026년 4월 MIT 라이선스로 공개한 최신 오픈소스 모델로, 정교한 강화 학습을 통해 코딩 및 에이전트 성능을 목표로 GLM-5를 후훈련 업그레이드했습니다. 동일한 7,440억 MoE 구조(400억 활성 매개변수)와 200K 토큰 컨텍스트 창을 기반으로, SWE-Bench Pro에서 58.4%를 기록하여 Claude Opus 4.6(57.3%)을 넘어섰습니다. 사람의 개입 없이 최대 8시간 동안 계획-실행-테스트-수정-최적화의 전체 루프를 자율적으로 관리할 수 있어, 장기 에이전트형 엔지니어링 작업을 위한 가장 강력한 오픈 가중치 모델 중 하나입니다.

심층 사고|공개 모델MIT

학습 완료일

2025

이 AI가 학습을 마친 날짜입니다. 이후 발생한 사건이나 정보는 알지 못할 수 있습니다.

입력 형식 → 출력 형식

이 AI에게 전달할 수 있는 정보 유형과, AI가 생성할 수 있는 결과물 유형을 나타냅니다.

처리용량

203KIN66KOUT

한 번의 요청에서 AI가 한꺼번에 읽고 처리할 수 있는 최대 분량입니다. 숫자가 클수록 긴 문서나 대화를 처리할 수 있습니다.

개별 비용(백만 글자)

$1.05IN$3.5OUT

이 AI를 직접 연동해 사용할 때 발생하는 비용입니다. 텍스트 100만 단위(토큰)당 달러 기준으로 표시됩니다.

비용 계산하기

AI 성능 평가

Arena 종합 점수

1470

±7

집계일 2026-04-23

종합 순위

15위

9,028 투표수

Arena 능력별 점수

한국어 능력

1411±4025위

복잡한 질문

1489±819위

전문 지식

1486±2125위

지시 이행

1460±1115위

대화 기억

1474±1621위

창의력

1451±1612위

코딩 실력

1520±1210위

수학 능력

1475±2412위

Arena 직군별 점수

문학·창작

1457±1315위

생활·사회과학

1490±1510위

엔터·미디어

1451±1513위

경영·금융

1455±1429위

의학·보건

1462±2350위

법률·행정

1476±2320위

소프트웨어·IT

1508±1015위

수학·통계

1476±2615위

출처:Arena Intelligence

종합

AA Intelligence Index

51%↑13%

LiveBench

71%↑10%

추론·수학

GPQA Diamond

87%↑6%

HLE

28%↑11%

LB 추론

73%↑13%

LB 수학

85%↑11%

LB 데이터 분석

63%↑14%

코딩

AA Coding Index

43%↑9%

LB 코딩

75%↑2%

LB 에이전틱

55%↑12%

TAU2

98%↑24%

TerminalBench

43%↑12%

SciCode

44%↑3%

언어·지시

IFBench

76%↑20%

AA-LCR

62%↑1%

환각률 (HHEM)

10%↑0%

사실 일관성 (HHEM)

90%↑0%

LB 언어

72%↑0%

LB 지시

68%↑22%

출력 속도

일반 모드

47tok/s↓35

출력 시작 1.30s

추론 모드

53tok/s↓35

출력 시작 72.52s

출처:Artificial Analysis LiveBench Vectara HHEM

Z.ai