AI 비교하기AI 사용하기AI 최신정보AI 커뮤니티
우리의 비전이용약관개인정보처리방침문의하기
OpenAI
OpenAI

GPT-5

비교
Model ID:gpt-5-2025-08-07
2025-08-07
비교

GPT-5는 2025년 중반에 출시된 OpenAI의 통합 프론티어 모델로, 고급 추론, 코딩, 멀티모달 기능을 하나의 시스템에 통합했습니다. 설정 가능한 사고 깊이와 테스트 시 연산 확장을 도입하여 이전 모델 대비 환각과 아부성 응답을 크게 줄였습니다. 단계별 추론, 지시 따르기, 정확한 판단이 중요한 복잡한 다단계 작업에 뛰어나며, 코딩, 글쓰기, 사실 기반 신뢰성에서 눈에 띄는 향상을 보여줍니다.

API|비전심층 사고웹 검색파일|상용 모델
학습 완료일
2024-09-30

이 AI가 학습을 마친 날짜입니다. 이후 발생한 사건이나 정보는 알지 못할 수 있습니다.

입력 형식 → 출력 형식

이 AI에게 전달할 수 있는 정보 유형과, AI가 생성할 수 있는 결과물 유형을 나타냅니다.

처리용량
400KIN128KOUT

한 번의 요청에서 AI가 한꺼번에 읽고 처리할 수 있는 최대 분량입니다. 숫자가 클수록 긴 문서나 대화를 처리할 수 있습니다.

개별 비용(백만 글자)
$1.25IN$10OUT

이 AI를 직접 연동해 사용할 때 발생하는 비용입니다. 텍스트 100만 단위(토큰)당 달러 기준으로 표시됩니다.

비용 계산하기
출처:공식 문서OpenRouter

AI 성능 평가

Arena 종합 점수
1434
±5
집계일 2026-05-01
종합 순위
60위
31,971 투표수
Arena 능력별 점수
한국어 능력
1401±2336위
복잡한 질문
1446±672위
전문 지식
1458±1654위
지시 이행
1409±780위
대화 기억
1420±980위
창의력
1375±10100위
코딩 실력
1466±876위
수학 능력
1434±1452위
Arena 직군별 점수
문학·창작
1397±882위
생활·사회과학
1443±972위
엔터·미디어
1398±867위
경영·금융
1414±985위
의학·보건
1456±1562위
법률·행정
1455±1447위
소프트웨어·IT
1452±787위
수학·통계
1441±1458위
출처:Arena Intelligence
종합
AA Intelligence Index
15%↓18%
LiveBench
71%↑10%
ForecastBench
61%↑2%
추론·수학
AA Math Index
48%↓28%
GPQA Diamond
69%↓16%
HLE
5.8%↓14%
MMLU-Pro
82%↑0%
AIME 2025
48%↓28%
LB 추론
82%↑12%
LB 수학
86%↑10%
LB 데이터 분석
57%↑2%
코딩
AA Coding Index
21%↓17%
LiveCodeBench
54%↓11%
LB 코딩
72%↓1%
LB 에이전틱
52%↑4%
TAU2
0.0%↓84%
TerminalBench
13%↓22%
SciCode
38%↓5%
언어·지시
IFBench
45%↓19%
AA-LCR
64%↑0%
환각률 (HHEM)
15%↑5%
사실 일관성 (HHEM)
85%↓5%
LB 언어
81%↑8%
LB 지시
64%↑10%
출력 속도
일반 모드
77tok/s↓7
출력 시작 1.03s
추론 모드
85tok/s↓12
출력 시작 41.72s
출처:Artificial AnalysisLiveBenchForecastBenchVectara HHEM
OpenAIOpenAI