OpenAI
OpenAI

GPT-4.1

2025-04-14

GPT-4.1은 2025년 4월에 출시된 OpenAI의 플래그십 언어 모델로, 코딩, 지시 따르기, 장문 맥락 추론에 최적화되어 있습니다. GPT-4o의 8배 이상인 100만 토큰 컨텍스트 창을 지원하며, SWE-bench Verified에서 54.6%를 달성하여 실제 소프트웨어 엔지니어링 작업에서 큰 성능 향상을 보여줍니다. 정확한 코드 차분 생성, 에이전트 안정성, 대규모 문서에서의 높은 정보 검출에 강점이 있어 IDE 도구, 자동화 코딩 에이전트, 기업용 지식 검색에 적합합니다.

API|비전웹 검색파일|상용 모델
학습 완료일
2024-06-30
입력 형식 → 출력 형식
처리용량
1.0MIN33KOUT
개별 비용(백만 글자)
$2IN$8OUT
비용 계산하기

AI 성능 평가

Arena 종합 점수
1312
±4
집계일 2026-04-23
종합 순위
207위
100,105 투표수
Arena 능력별 점수
한국어 능력
1254±21154위
복잡한 질문
1311±6213위
전문 지식
1286±12206위
지시 이행
1294±6205위
대화 기억
1298±8206위
창의력
1285±8194위
코딩 실력
1338±7214위
수학 능력
1303±8184위
Arena 직군별 점수
문학·창작
1306±6188위
생활·사회과학
1321±8211위
엔터·미디어
1290±8182위
경영·금융
1282±9226위
의학·보건
1305±12212위
법률·행정
1317±11215위
소프트웨어·IT
1324±6221위
수학·통계
1308±8186위
종합
AA Intelligence Index
26%↓12%
ForecastBench
59%↑0%
추론·수학
AA Math Index
35%↓39%
GPQA Diamond
67%↓14%
HLE
4.6%↓13%
MMLU-Pro
81%↓1%
AIME 2025
35%↓39%
MATH-500
91%↓2%
코딩
AA Coding Index
22%↓12%
LiveCodeBench
46%↓20%
TAU2
47%↓26%
TerminalBench
14%↓17%
SciCode
38%↓3%
언어·지시
IFBench
43%↓14%
AA-LCR
61%↓1%
환각률 (HHEM)
5.6%↓5%
사실 일관성 (HHEM)
94%↑4%
출력 속도
일반 모드
103tok/s↑21
출력 시작 0.58s