OpenAI

GPT-5

Name: OpenAI GPT-5
Author: OpenAI

비교

Model ID:gpt-5-2025-08-07

2025-08-07

비교

GPT-5는 2025년 중반에 출시된 OpenAI의 통합 프론티어 모델로, 고급 추론, 코딩, 멀티모달 기능을 하나의 시스템에 통합했습니다. 설정 가능한 사고 깊이와 테스트 시 연산 확장을 도입하여 이전 모델 대비 환각과 아부성 응답을 크게 줄였습니다. 단계별 추론, 지시 따르기, 정확한 판단이 중요한 복잡한 다단계 작업에 뛰어나며, 코딩, 글쓰기, 사실 기반 신뢰성에서 눈에 띄는 향상을 보여줍니다.

API|비전심층 사고웹 검색파일|상용 모델

학습 완료일

2024-09-30

이 AI가 학습을 마친 날짜입니다. 이후 발생한 사건이나 정보는 알지 못할 수 있습니다.

입력 형식 → 출력 형식

이 AI에게 전달할 수 있는 정보 유형과, AI가 생성할 수 있는 결과물 유형을 나타냅니다.

처리용량

400KIN128KOUT

한 번의 요청에서 AI가 한꺼번에 읽고 처리할 수 있는 최대 분량입니다. 숫자가 클수록 긴 문서나 대화를 처리할 수 있습니다.

개별 비용(백만 글자)

$1.25IN$10OUT

이 AI를 직접 연동해 사용할 때 발생하는 비용입니다. 텍스트 100만 단위(토큰)당 달러 기준으로 표시됩니다.

비용 계산하기

출처:공식 문서 OpenRouter

AI 성능 평가

Arena 종합 점수

1434

±5

집계일 2026-05-01

종합 순위

60위

31,971 투표수

Arena 능력별 점수

한국어 능력

1401±2336위

복잡한 질문

1446±672위

전문 지식

1458±1654위

지시 이행

1409±780위

대화 기억

1420±980위

창의력

1375±10100위

코딩 실력

1466±876위

수학 능력

1434±1452위

Arena 직군별 점수

문학·창작

1397±882위

생활·사회과학

1443±972위

엔터·미디어

1398±867위

경영·금융

1414±985위

의학·보건

1456±1562위

법률·행정

1455±1447위

소프트웨어·IT

1452±787위

수학·통계

1441±1458위

출처:Arena Intelligence

종합

AA Intelligence Index

15%↓18%

LiveBench

71%↑10%

ForecastBench

61%↑2%

추론·수학

AA Math Index

48%↓28%

GPQA Diamond

69%↓16%

HLE

5.8%↓14%

MMLU-Pro

82%↑0%

AIME 2025

48%↓28%

LB 추론

82%↑12%

LB 수학

86%↑10%

LB 데이터 분석

57%↑2%

코딩

AA Coding Index

21%↓17%

LiveCodeBench

54%↓11%

LB 코딩

72%↓1%

LB 에이전틱

52%↑4%

TAU2

0.0%↓84%

TerminalBench

13%↓22%

SciCode

38%↓5%

언어·지시

IFBench

45%↓19%

AA-LCR

64%↑0%

환각률 (HHEM)

15%↑5%

사실 일관성 (HHEM)

85%↓5%

LB 언어

81%↑8%

LB 지시

64%↑10%

출력 속도

일반 모드

77tok/s↓7

출력 시작 1.03s

추론 모드

85tok/s↓12

출력 시작 41.72s

출처:Artificial Analysis LiveBench ForecastBench Vectara HHEM

OpenAI

AI 성능 평가

Arena 종합 점수

1434

±5

집계일 2026-05-01

종합 순위

60위

31,971 투표수

Arena 능력별 점수

한국어 능력

1401±2336위

복잡한 질문

1446±672위

전문 지식

1458±1654위

지시 이행

1409±780위

대화 기억

1420±980위

창의력

1375±10100위

코딩 실력

1466±876위

수학 능력

1434±1452위

Arena 직군별 점수

문학·창작

1397±882위

생활·사회과학

1443±972위

엔터·미디어

1398±867위

경영·금융

1414±985위

의학·보건

1456±1562위

법률·행정

1455±1447위

소프트웨어·IT

1452±787위

수학·통계

1441±1458위

종합

AA Intelligence Index

15%↓18%

LiveBench

71%↑10%

ForecastBench

61%↑2%

추론·수학

AA Math Index

48%↓28%

GPQA Diamond

69%↓16%

HLE

5.8%↓14%

MMLU-Pro

82%↑0%

AIME 2025

48%↓28%

LB 추론

82%↑12%

LB 수학

86%↑10%

LB 데이터 분석

57%↑2%

코딩

AA Coding Index

21%↓17%

LiveCodeBench

54%↓11%

LB 코딩

72%↓1%

LB 에이전틱

52%↑4%

TAU2

0.0%↓84%

TerminalBench

13%↓22%

SciCode

38%↓5%

언어·지시

IFBench

45%↓19%

AA-LCR

64%↑0%

환각률 (HHEM)

15%↑5%

사실 일관성 (HHEM)

85%↓5%

LB 언어

81%↑8%

LB 지시

64%↑10%

출력 속도

일반 모드

77tok/s↓7

출력 시작 1.03s

추론 모드

85tok/s↓12

출력 시작 41.72s