AI 비교하기AI 사용하기AI 최신정보AI 커뮤니티
우리의 비전이용약관개인정보처리방침문의하기
OpenAI
OpenAI

GPT-5.4

비교
Model ID:gpt-5.4-2026-03-05
2026-03-05
비교

GPT-5.4는 2026년 3월에 출시된 OpenAI의 최신 프론티어 모델로, Codex와 GPT 제품군을 단일 시스템으로 통합했습니다. 100만 토큰 이상의 컨텍스트 창, 네이티브 컴퓨터 조작 기능, GPT-5.3-Codex에서 이어받은 최고 수준의 코딩 성능을 갖추고 있습니다. GPT-5.2 대비 토큰 효율이 크게 향상되었으며, 44개 직종에 걸친 지식 업무 벤치마크에서 전문가와 83% 동등 이상의 성과를 기록합니다. 에이전트형 코딩, 문서 이해, 도구 활용, 복잡한 다단계 워크플로에 뛰어납니다.

OpenAI PlusOpenAI ProAPI|비전심층 사고웹 검색파일|상용 모델
학습 완료일
2025-08-31

이 AI가 학습을 마친 날짜입니다. 이후 발생한 사건이나 정보는 알지 못할 수 있습니다.

입력 형식 → 출력 형식

이 AI에게 전달할 수 있는 정보 유형과, AI가 생성할 수 있는 결과물 유형을 나타냅니다.

처리용량
1.1MIN128KOUT

한 번의 요청에서 AI가 한꺼번에 읽고 처리할 수 있는 최대 분량입니다. 숫자가 클수록 긴 문서나 대화를 처리할 수 있습니다.

개별 비용(백만 글자)
$2.5IN$15OUT

이 AI를 직접 연동해 사용할 때 발생하는 비용입니다. 텍스트 100만 단위(토큰)당 달러 기준으로 표시됩니다.

비용 계산하기
출처:공식 문서OpenAI GPT-5 BlogLMSYS Chatbot ArenaOpenRouter

AI 성능 평가

Arena 종합 점수
1477
±5
집계일 2026-05-01
종합 순위
11위
15,853 투표수
Arena 능력별 점수
한국어 능력
1421±3621위
복잡한 질문
1502±79위
전문 지식
1524±176위
지시 이행
1480±98위
대화 기억
1497±117위
창의력
1444±1322위
코딩 실력
1527±108위
수학 능력
1514±18🥇 1위
Arena 직군별 점수
문학·창작
1467±108위
생활·사회과학
1480±1230위
엔터·미디어
1448±1215위
경영·금융
1483±1110위
의학·보건
1471±1942위
법률·행정
1476±1826위
소프트웨어·IT
1510±816위
수학·통계
1516±205위
출처:Arena Intelligence
종합
AA Intelligence Index
51%↑18%
LiveBench
81%↑20%
ForecastBench
59%↑0%
추론·수학
GPQA Diamond
92%↑8%
HLE
42%↑21%
LB 추론
88%↑19%
LB 수학
94%↑18%
LB 데이터 분석
79%↑25%
코딩
AA Coding Index
71%↑33%
LB 코딩
78%↑5%
LB 에이전틱
70%↑23%
TAU2
87%↑3%
TerminalBench
58%↑23%
SciCode
57%↑14%
언어·지시
IFBench
74%↑10%
AA-LCR
74%↑11%
환각률 (HHEM)
7.0%↓3%
사실 일관성 (HHEM)
93%↑3%
LB 언어
83%↑10%
LB 지시
70%↑17%
출력 속도
일반 모드
158tok/s↑74
출력 시작 0.54s
추론 모드
170tok/s↑72
출력 시작 4.09s
출처:Artificial AnalysisLiveBenchForecastBenchVectara HHEM

다국어 역량

MGSM 🇰🇷
94%
MGSM 🇯🇵
92%
KMMLU 🇰🇷
77%
JMMLU 🇯🇵
75%
OpenAIOpenAI