1 / 3
左右にスワイプ

HappyHorse 1.0は、AlibabaのTaotian Future Life Labが開発した動画生成モデルで、Artificial Analysis Video Arenaのテキスト・トゥ・ビデオ部門(Elo 1381、2位に107点差)と画像・トゥ・ビデオ部門(Elo 1392)の両方で1位を獲得しています。150億パラメータ・40層の統合self-attention Transformerにより、cross-attentionモジュールを使わず動画と音声を1回のフォワードパスで同時生成します。テキスト・トゥ・ビデオ、画像・トゥ・ビデオ、動画編集、参照画像・トゥ・ビデオの各ワークフローに対応し、720p/1080p、3〜15秒のクリップ、英語・中国語(標準語)・広東語・日本語・韓国語・ドイツ語・フランス語のネイティブ多言語リップシンクをサポート。NVIDIA H100一基で1080pクリップを約38秒で生成すると発表されています。fal.aiで720p $0.14/秒、1080p $0.28/秒で提供。

提供元
AlibabaAlibaba
リリース日
2026-04-26
学習完了日
非公開
ライセンス
商用モデル
入出力形式
コンテキスト長
API入出力 (1M)
$0.14~$0.28/second
利用方法
出力速度
Arena 総合
Intelligence Index
Coding Index
Math Index
LiveBench
ForecastBench
GPQA Diamond
HLE
MMLU-Pro
AIME 2025
MATH-500
LB 推論
LB 数学
LB データ分析
LiveCodeBench
LB コーディング
LB エージェンティック
TAU2
TerminalBench
SciCode
IFBench
AA-LCR
幻覚率 (HHEM)
事実一貫性 (HHEM)
LB 言語
LB 指示