Anthropic

Claude Opus 4

Name: Anthropic Claude Opus 4
Author: Anthropic

비교

Model ID:claude-opus-4-20250514

2025-05-22

비교

Claude Opus 4는 2025년 5월에 출시된 Anthropic의 획기적인 코딩 및 에이전트 모델로, 복잡한 장시간 작업에서 지속적인 성능의 새로운 기준을 세웠습니다. SWE-bench(72.5%)와 Terminal-bench(43.2%)에서 선두를 기록하며, 수천 단계의 에이전트 워크플로를 성능 저하 없이 수 시간 동안 연속 처리할 수 있습니다. 하이브리드 모델로서 즉각적인 응답과 깊은 사고를 위한 확장 사고 모드를 모두 지원하며, 병렬 도구 사용과 향상된 지시 기억 능력을 갖추고 있습니다.

API|비전심층 사고웹 검색파일|상용 모델

학습 완료일

2025-05-01

이 AI가 학습을 마친 날짜입니다. 이후 발생한 사건이나 정보는 알지 못할 수 있습니다.

입력 형식 → 출력 형식

이 AI에게 전달할 수 있는 정보 유형과, AI가 생성할 수 있는 결과물 유형을 나타냅니다.

처리용량

1MIN128KOUT

한 번의 요청에서 AI가 한꺼번에 읽고 처리할 수 있는 최대 분량입니다. 숫자가 클수록 긴 문서나 대화를 처리할 수 있습니다.

개별 비용(백만 글자)

$15IN$75OUT

이 AI를 직접 연동해 사용할 때 발생하는 비용입니다. 텍스트 100만 단위(토큰)당 달러 기준으로 표시됩니다.

비용 계산하기

출처:공식 문서 OpenRouter

AI 성능 평가

Arena 종합 점수

1424

±4

집계일 2026-04-23

종합 순위

66위

36,951 투표수

Arena 능력별 점수

한국어 능력

1379±2350위

복잡한 질문

1455±653위

전문 지식

1446±1466위

지시 이행

1442±733위

대화 기억

1437±855위

창의력

1429±933위

코딩 실력

1498±836위

수학 능력

1419±1270위

Arena 직군별 점수

문학·창작

1429±737위

생활·사회과학

1439±870위

엔터·미디어

1420±839위

경영·금융

1412±882위

의학·보건

1446±1369위

법률·행정

1436±1265위

소프트웨어·IT

1466±653위

수학·통계

1424±1368위

출처:Arena Intelligence

종합

AA Intelligence Index

39%↑1%

ForecastBench

61%↑2%

추론·수학

AA Math Index

73%↑0%

GPQA Diamond

80%↓1%

HLE

12%↓5%

MMLU-Pro

87%↑5%

AIME 2025

73%↑0%

MATH-500

98%↑5%

코딩

AA Coding Index

34%↑0%

LiveCodeBench

64%↓2%

TAU2

73%↑0%

TerminalBench

31%↑0%

SciCode

40%↓1%

언어·지시

IFBench

54%↓3%

AA-LCR

34%↓28%

환각률 (HHEM)

12%↑2%

사실 일관성 (HHEM)

88%↓2%

출력 속도

일반 모드

34tok/s↓48

출력 시작 1.33s

추론 모드

48tok/s↓40

출력 시작 7.45s

출처:Artificial Analysis ForecastBench Vectara HHEM

Anthropic