Alibaba
Alibaba

HappyHorse 1.0

2026-04-26

HappyHorse 1.0は、AlibabaのTaotian Future Life Labが開発した動画生成モデルで、Artificial Analysis Video Arenaのテキスト・トゥ・ビデオ部門(Elo 1381、2位に107点差)と画像・トゥ・ビデオ部門(Elo 1392)の両方で1位を獲得しています。150億パラメータ・40層の統合self-attention Transformerにより、cross-attentionモジュールを使わず動画と音声を1回のフォワードパスで同時生成します。テキスト・トゥ・ビデオ、画像・トゥ・ビデオ、動画編集、参照画像・トゥ・ビデオの各ワークフローに対応し、720p/1080p、3〜15秒のクリップ、英語・中国語(標準語)・広東語・日本語・韓国語・ドイツ語・フランス語のネイティブ多言語リップシンクをサポート。NVIDIA H100一基で1080pクリップを約38秒で生成すると発表されています。fal.aiで720p $0.14/秒、1080p $0.28/秒で提供。

ビジョン|商用モデル
学習完了日
非公開
入力形式 → 出力形式
処理容量
N/A
個別料金
$0.14 ~ $0.28/ sec
費用を計算する