ElevenLabs v3は、ElevenLabsの最も先進的かつ表現力豊かな音声合成モデルで、70以上の言語に対応しています。ゼロから設計され、ため息、ささやき、笑い、反応などを表現する音声を生成し、本当に生きているかのような応答性のある発話を実現します。キャラクターの台詞、クリエイティブコンテンツ、感情の深さと音声の自然さが不可欠なあらゆる用途に最適です。リアルタイムや会話型の用途にはFlash v2.5が推奨されており、v3のリアルタイム版は現在開発中です。
API|商用モデル
出典:公式ドキュメント