Qwen 3.6 Plus는 2026년 4월에 출시된 알리바바의 최신 플래그십 언어 모델로, 에이전트형 코딩, 멀티모달 코드 생성, 100만 토큰 컨텍스트 처리에서 큰 발전을 이루었습니다. 네이티브 멀티모달 모델로서 스크린샷, 디자인 시안, 텍스트 프롬프트로부터 프론트엔드 웹 페이지를 생성할 수 있으며, 반복적인 작성-테스트-디버깅 과정을 통해 복잡한 프로그래밍 작업을 자율적으로 분해합니다. SWE-bench와 Terminal-Bench 2.0 등 프로그래밍·에이전트 벤치마크에서 Claude Opus 4.5에 대등한 성능을 보여, 기업용 에이전트형 AI 배포에 강력한 후보입니다.
비전심층 사고|상용 모델
AI 성능 평가
Arena 종합 점수
1447
±8집계일 2026-04-23
종합 순위
41위
5,480 투표수
Arena 능력별 점수
복잡한 질문
1466±1039위
전문 지식
1483±2727위
지시 이행
1434±1439위
대화 기억
1434±1956위
창의력
1390±2076위
코딩 실력
1502±1530위
수학 능력
1484±297위
Arena 직군별 점수
문학·창작
1420±1646위
생활·사회과학
1447±1963위
엔터·미디어
1400±1855위
경영·금융
1457±1827위
의학·보건
1472±3237위
법률·행정
1445±3056위
소프트웨어·IT
1484±1339위
수학·통계
1451±3133위
종합
AA Intelligence Index
50%↑12%
LiveBench
71%↑10%
추론·수학
GPQA Diamond
88%↑7%
HLE
26%↑9%
LB 추론
76%↑16%
LB 수학
84%↑10%
LB 데이터 분석
70%↑20%
코딩
AA Coding Index
43%↑9%
LB 코딩
78%↑5%
LB 에이전틱
55%↑12%
TAU2
98%↑24%
TerminalBench
44%↑13%
SciCode
41%↑0%
언어·지시
IFBench
75%↑18%
AA-LCR
70%↑8%
LB 언어
75%↑3%
LB 지시
58%↑12%
출력 속도
일반 모드
53tok/s↓29
출력 시작 106.67s