GPT-4o Transcribe는 OpenAI의 고급 음성 인식 모델로, GPT-4o 구조를 기반으로 최대한의 전사 정확도를 제공합니다. Whisper와 GPT-4o Mini Transcribe 대비 더 낮은 단어 오류율과 우수한 언어 인식 성능을 갖추어 높은 정확도가 요구되는 전사 작업에 최적입니다. 웹소켓을 통한 실시간 오디오 스트리밍, 전문 용어를 위한 문맥 프롬프트, 신뢰도 평가를 위한 로그 확률 출력을 지원합니다.
API|상용 모델
AI 성능 평가
출력 속도
일반 모드
31tok/s↓51
출력 시작 0.70s