AI 비교하기AI 사용하기AI 최신정보AI 커뮤니티
우리의 비전이용약관개인정보처리방침문의하기
OpenAI
OpenAI

GPT-4.1

비교
Model ID:gpt-4.1-2025-04-14
2025-04-14
비교

GPT-4.1은 2025년 4월에 출시된 OpenAI의 플래그십 언어 모델로, 코딩, 지시 따르기, 장문 맥락 추론에 최적화되어 있습니다. GPT-4o의 8배 이상인 100만 토큰 컨텍스트 창을 지원하며, SWE-bench Verified에서 54.6%를 달성하여 실제 소프트웨어 엔지니어링 작업에서 큰 성능 향상을 보여줍니다. 정확한 코드 차분 생성, 에이전트 안정성, 대규모 문서에서의 높은 정보 검출에 강점이 있어 IDE 도구, 자동화 코딩 에이전트, 기업용 지식 검색에 적합합니다.

API|비전웹 검색파일|상용 모델
학습 완료일
2024-06-30

이 AI가 학습을 마친 날짜입니다. 이후 발생한 사건이나 정보는 알지 못할 수 있습니다.

입력 형식 → 출력 형식

이 AI에게 전달할 수 있는 정보 유형과, AI가 생성할 수 있는 결과물 유형을 나타냅니다.

처리용량
1.0MIN33KOUT

한 번의 요청에서 AI가 한꺼번에 읽고 처리할 수 있는 최대 분량입니다. 숫자가 클수록 긴 문서나 대화를 처리할 수 있습니다.

개별 비용(백만 글자)
$2IN$8OUT

이 AI를 직접 연동해 사용할 때 발생하는 비용입니다. 텍스트 100만 단위(토큰)당 달러 기준으로 표시됩니다.

비용 계산하기
출처:공식 문서OpenRouter

AI 성능 평가

Arena 종합 점수
1312
±4
집계일 2026-05-01
종합 순위
216위
100,105 투표수
Arena 능력별 점수
한국어 능력
1255±21157위
복잡한 질문
1311±6222위
전문 지식
1286±12215위
지시 이행
1294±6213위
대화 기억
1298±8215위
창의력
1285±8203위
코딩 실력
1338±7223위
수학 능력
1303±8192위
Arena 직군별 점수
문학·창작
1306±6197위
생활·사회과학
1321±8220위
엔터·미디어
1290±8191위
경영·금융
1282±9235위
의학·보건
1305±12220위
법률·행정
1317±11223위
소프트웨어·IT
1324±6230위
수학·통계
1308±8194위
출처:Arena Intelligence
종합
AA Intelligence Index
19%↓14%
ForecastBench
59%↓1%
추론·수학
AA Math Index
35%↓42%
GPQA Diamond
67%↓18%
HLE
4.6%↓16%
MMLU-Pro
81%↓1%
AIME 2025
35%↓42%
MATH-500
91%↓3%
코딩
AA Coding Index
22%↓16%
LiveCodeBench
46%↓20%
TAU2
47%↓37%
TerminalBench
14%↓21%
SciCode
38%↓5%
언어·지시
IFBench
43%↓21%
AA-LCR
61%↓2%
환각률 (HHEM)
5.6%↓4%
사실 일관성 (HHEM)
94%↑4%
출력 속도
일반 모드
122tok/s↑38
출력 시작 0.56s
출처:Artificial AnalysisForecastBenchVectara HHEM
OpenAIOpenAI