GPT-4o Mini TTS는 OpenAI의 비용 효율적인 음성 합성 모델로, GPT-4o Mini 구조를 기반으로 합니다. 작성된 텍스트를 자연스럽고 표현력 있는 음성으로 변환하며, 프롬프트에 자연어 지시를 작성하여 어조, 속도, 강세 등 음성 특성을 세밀하게 제어할 수 있습니다. 이전 OpenAI 음성 합성 모델 대비 단어 오류율이 크게 낮아지고 운율이 더 자연스러워져, 음성 에이전트, 접근성 기능, 대규모 오디오 콘텐츠 제작에 적합합니다.
API|상용 모델
AI 성능 평가
언어·지시
환각률 (HHEM)
9.6%↓1%
사실 일관성 (HHEM)
90%↑1%