GPT-4o Transcribe는 OpenAI의 고급 음성 인식 모델로, GPT-4o 구조를 기반으로 최대한의 전사 정확도를 제공합니다. Whisper와 GPT-4o Mini Transcribe 대비 더 낮은 단어 오류율과 우수한 언어 인식 성능을 갖추어 높은 정확도가 요구되는 전사 작업에 최적입니다. 웹소켓을 통한 실시간 오디오 스트리밍, 전문 용어를 위한 문맥 프롬프트, 신뢰도 평가를 위한 로그 확률 출력을 지원합니다.
API|상용 모델
학습 완료일
2024-06-01
이 AI가 학습을 마친 날짜입니다. 이후 발생한 사건이나 정보는 알지 못할 수 있습니다.
입력 형식 → 출력 형식
이 AI에게 전달할 수 있는 정보 유형과, AI가 생성할 수 있는 결과물 유형을 나타냅니다.
처리용량
—
한 번의 요청에서 AI가 한꺼번에 읽고 처리할 수 있는 최대 분량입니다. 숫자가 클수록 긴 문서나 대화를 처리할 수 있습니다.
개별 비용(백만 글자)
$2.5IN$10OUT
이 AI를 직접 연동해 사용할 때 발생하는 비용입니다. 텍스트 100만 단위(토큰)당 달러 기준으로 표시됩니다.