ElevenLabs Multilingual v2는 감정 인식 음성 합성 모델로, 여러 언어에서 높은 감정 표현력과 깊은 맥락 이해를 바탕으로 자연스럽고 생동감 있는 음성을 생성합니다. Flash 모델보다 세밀한 표현과 자연스러운 운율을 갖춘 ElevenLabs 제품군 최고 품질의 오디오를 제공하며, 오디오북 내레이션, 완성도 높은 다국어 콘텐츠, 풍부함과 자연스러움이 속도보다 중요한 전문 성우 작업에 적합합니다.
API|상용 모델
출처:공식 문서