Claude Sonnet 4.5는 4.6 세대 이전에 출시된 Anthropic의 가장 발전된 Sonnet 모델로, 실제 에이전트와 코딩 워크플로에 최적화되어 있습니다. 시스템 설계, 코드 보안, 사양 준수에서 개선된 최고 수준의 코딩 성능을 제공합니다. 사실 기반 진행 추적을 통한 장기 자율 운영에 맞게 설계되었으며, 투기적 병렬 실행, 향상된 도구 조율, 다중 컨텍스트·장기 워크플로를 위한 효율적인 맥락 및 메모리 관리 등 강화된 에이전트 기능을 도입했습니다.
Anthropic FreeAnthropic ProAnthropic Max (5x)Anthropic Max (20x)API|비전심층 사고웹 검색파일|상용 모델
AI 성능 평가
Arena 종합 점수
1453
±3집계일 2026-04-23
종합 순위
30위
63,725 투표수
Arena 능력별 점수
한국어 능력
1380±2049위
복잡한 질문
1485±422위
전문 지식
1498±1015위
지시 이행
1463±514위
대화 기억
1469±627위
창의력
1442±724위
코딩 실력
1519±614위
수학 능력
1454±1028위
Arena 직군별 점수
문학·창작
1446±623위
생활·사회과학
1467±634위
엔터·미디어
1438±622위
경영·금융
1454±630위
의학·보건
1465±1047위
법률·행정
1458±1041위
소프트웨어·IT
1498±522위
수학·통계
1467±1122위
종합
AA Intelligence Index
43%↑5%
LiveBench
51%↓9%
ForecastBench
60%↑1%
추론·수학
AA Math Index
88%↑15%
GPQA Diamond
83%↑2%
HLE
17%↑0%
MMLU-Pro
88%↑6%
AIME 2025
88%↑14%
LB 추론
42%↓17%
LB 수학
63%↓11%
LB 데이터 분석
47%↓3%
코딩
AA Coding Index
39%↑5%
LiveCodeBench
71%↑6%
LB 코딩
76%↑2%
LB 에이전틱
48%↑5%
TAU2
78%↑5%
TerminalBench
36%↑5%
SciCode
45%↑4%
언어·지시
IFBench
57%↑1%
AA-LCR
66%↑4%
환각률 (HHEM)
12%↑2%
사실 일관성 (HHEM)
88%↓2%
LB 언어
76%↑4%
LB 지시
24%↓23%
출력 속도
일반 모드
44tok/s↓38
출력 시작 0.80s
추론 모드
60tok/s↓28
출력 시작 8.01s