1 / 3
좌우로 스와이프

GPT Audio는 OpenAI의 멀티모달 오디오 모델로, 대화 완성 API를 통해 음성 대 음성 상호작용을 기본적으로 지원합니다. 음성 인식과 음성 합성을 별도 모델로 연결하는 기존 파이프라인과 달리, 단일 모델에서 음성을 직접 처리하고 생성하여 지연 시간이 짧고 자연스러운 음성을 출력하며, 어조와 감정 같은 미묘한 뉘앙스도 잘 보존합니다.

제공사
OpenAIOpenAI
출시일
2025-08-28
학습완료일
2023-10-01
라이선스
상용 모델
입출력 형식
처리용량
128K / 16K
API 입출력 (1M)
$2.5 / $10
사용 방법
출력 속도
Arena 종합
Intelligence Index
Coding Index
Math Index
LiveBench
ForecastBench
GPQA Diamond
HLE
MMLU-Pro
AIME 2025
MATH-500
LB 추론
LB 수학
LB 데이터 분석
LiveCodeBench
LB 코딩
LB 에이전틱
TAU2
TerminalBench
SciCode
IFBench
AA-LCR
환각률 (HHEM)
사실 일관성 (HHEM)
LB 언어
LB 지시