AI 모델 비교 | aib vote

우리들의 비전

GPT Audio는 OpenAI의 멀티모달 오디오 모델로, 대화 완성 API를 통해 음성 대 음성 상호작용을 기본적으로 지원합니다. 음성 인식과 음성 합성을 별도 모델로 연결하는 기존 파이프라인과 달리, 단일 모델에서 음성을 직접 처리하고 생성하여 지연 시간이 짧고 자연스러운 음성을 출력하며, 어조와 감정 같은 미묘한 뉘앙스도 잘 보존합니다.

제공사

OpenAI

OpenAI

출시일

2025-08-28

학습완료일

2023-10-01

라이선스

상용 모델

입출력 형식

처리용량

128K / 16K

API 입출력 (1M)

$2.5 / $10

사용 방법

—

출력 속도

—

Arena 종합

—

Intelligence Index

—

Coding Index

—

Math Index

—

LiveBench

—

ForecastBench

—

GPQA Diamond

—

HLE

—

MMLU-Pro

—

AIME 2025

—

MATH-500

—

LB 추론

—

LB 수학

—

LB 데이터 분석

—

LiveCodeBench

—

LB 코딩

—

LB 에이전틱

—

TAU2

—

TerminalBench

—

SciCode

—

IFBench

—

AA-LCR

—

환각률 (HHEM)

—

사실 일관성 (HHEM)

—

LB 언어

—

LB 지시

—

비용 계산하기 AI 모델 상세 페이지

1 / 3

좌우로 스와이프

GPT Audio는 OpenAI의 멀티모달 오디오 모델로, 대화 완성 API를 통해 음성 대 음성 상호작용을 기본적으로 지원합니다. 음성 인식과 음성 합성을 별도 모델로 연결하는 기존 파이프라인과 달리, 단일 모델에서 음성을 직접 처리하고 생성하여 지연 시간이 짧고 자연스러운 음성을 출력하며, 어조와 감정 같은 미묘한 뉘앙스도 잘 보존합니다.

제공사

OpenAI

OpenAI

출시일

2025-08-28

학습완료일

2023-10-01

라이선스

상용 모델

입출력 형식

처리용량

128K / 16K

API 입출력 (1M)

$2.5 / $10

사용 방법

—

출력 속도

—

Arena 종합

—

Intelligence Index

—

Coding Index

—

Math Index

—

LiveBench

—

ForecastBench

—

GPQA Diamond

—

HLE

—

MMLU-Pro

—

AIME 2025

—

MATH-500

—

LB 추론

—

LB 수학

—

LB 데이터 분석

—

LiveCodeBench

—

LB 코딩

—

LB 에이전틱

—

TAU2

—

TerminalBench

—

SciCode

—

IFBench

—

AA-LCR

—

환각률 (HHEM)

—

사실 일관성 (HHEM)

—

LB 언어

—

LB 지시

—

비용 계산하기 AI 모델 상세 페이지