神秘“欢乐马”空降屠榜,碾压Seedance 2.0,動画AIまた変わるのか?

robot
概要作成中

火曜の深夜、AI業界が大騒ぎになった。

世界的に有名なAI評価プラットフォームArtificial AnalysisのVideo Arenaランキングで、コードネーム**「HappyHorse-1.0」**という謎の動画生成モデルがひっそりとトップに躍り出た——発表会もなく、技術ブログもなく、いかなる企業の後ろ盾もないまま、圧倒する勢いで首位に登り詰めた。

原稿執筆時点までに、テキストから動画を生成する分野ではEloスコアが1357点に急上昇し、ちょうど5日前に首位に躍り出たSeedance 2.0に84点差をつけている。さらに3位と4位のSkyReels V4およびKling 3.0 1080p Proを合わせても1080p Proのほうが100点以上上回っており、HappyHorse-1.0という1つのモデルだけで、業界全体の階層の差を引き離してしまった。

画像から動画を生成する分野でも1402点という凄まじい高得点を叩き出し、同ランキングの過去最高記録を更新した。

唯一少し見劣りするのは、ネイティブの効果音を含む「Video+音频」の総合順位で、HappyHorseが2位にとどまり、Seedance 2.0をわずかに下回っていることだ。

このランキング、そんなに簡単に刷れない

多くの人が最初に思ったのは、こういうことだろうか:これは点数稼ぎ(刷っている)なのでは?

この疑念には一理ある。しかしArtificial Analysisのランキング仕組みは、通常のスコアボードよりも簡単には操作できないように設計されている——すべての順位は、世界中の実在ユーザーによる「目隠し二択」盲検投票に基づく。ユーザーは完全に何も知らない状態で、2つの生成結果を比較して選択し、最終的にEloポイントへ集計される。

モデルチームは問題を“刷って”不正することで成果を反映させられない。反映されているのは、普通の人が見た後に最もリアルに感じた嗜好だ。

もちろん、それを指摘する人もいる。Artificial Analysisの盲検サンプルでは人物生成や口演(読み上げ)系コンテンツの割合が60%を超えており、HappyHorseは人物シーンで生来的に優位性があるため、ある程度評価スコアと実際の総合能力との間にギャップが生じうるというのだ。

そのためX上の議論は二派に分かれた。懐疑派は、HappyHorseとSeedance 2.0の間に、人物の細部や動きの連続性でまだはっきりした差があると考える。一方、支持者はその潜在力に大きな期待を寄せており、とりわけ複数カメラのシーケンスにおける画質の一貫性という業界の課題を解決してくれることを強く望んでいる。

次に、ネット上の評価によれば、一般の人のこのモデルに対する評価は総じてかなり高い。

「ハッピーホース」はいったい誰の“馬”?

こここそが、AI業界全体が最も解明したい問題だ。

X上の推測はすぐに広がった。最初に注目されたのは、公式サイトの言語の並び順だ:普通話と広東語が英語より前に来ている。グローバルユーザー向けのプロダクトでこの順序はかなり不自然で、その裏にいるチームが中国であることはほぼ確実だといえる。

名前自体も手がかりだ。2026年は旧暦の馬年で、「HappyHorse」という命名には、あまり含みのない“馬年ネタ”が隠されている。今年の早い時期にも「Pony Alpha」が同様の手口を使っていた。そこで、疑いのリストが一気に広がった。腾讯と阿里の創業者はいずれも姓が馬で、自然と候補に上がる。ある人は小米に賭けており、雷軍が普段は控えめで、突然切り札を見せるのが好きだと考えている。また、DeepSeekっぽい雰囲気だという意見もある。なぜならDSは以前、こっそり視覚モデルを投入しており、その後またこっそり撤回していたからだ。

XユーザーPassluoのコメントはなかなか含みがある:「この“楽しい馬”は誰のもの? 阿里、腾讯、それとも小米?」

技術面での“犯人当て”

名前だけでは足りない。技術界はすぐにホームズモードに入った。

XユーザーVigo ZhaoはHappyHorse-1.0の公開ベンチマークデータを、既知のモデルと1つずつ照合し、強く一致する対象を見つけた:daVinci-MagiHuman——つまり、今年3月にGitHubで公開されたオープンソースモデル「达芬奇魔法人类」。

![](https://img-cdn.gateio.im/social/moments-cbbe ce42cd-00294c0439-8b7abd-badf29) 視覚品質、テキストの整合性、物理的な一貫性など複数のデータが項目ごとに一致し、公式サイトの構造もほぼ同じだった。両者はいずれも単一ストリームTransformerアーキテクチャで、音声と映像の共同生成を行い、対応言語リストも完全に一致している。このレベルの重なりを偶然で説明するのは難しい。

現時点で技術界の認知度が比較的高い結論はこうだ:HappyHorseはdaVinci-MagiHumanの共同開発者の1つであるSand.aiであり、オープンソースモデルに基づいて最適化した反復版。コアとなる目的は、ユーザーの実際の嗜好のもとでモデルが到達できる上限を検証し、今後の商用展開に向けた布石とすることだ。

daVinci-MagiHumanは2026年3月23日に正式にオープンソース化され、2つの若いチームの協業の成果だ:

1つは上海の創智学院生成式AI研究実験室で、もう1つは北京のSand.ai(三呆科技)だ。モデルは150億パラメータの純粋な自己注意単一ストリームTransformerで、テキスト、動画、音声の3つのモダリティのtokenをすべて同一のシーケンスに投入して共同でモデリングする。

もう1つの手がかりは阿里淘天へ

一方で、世間には別のバージョンの推測も出回っている:

HappyHorseの背後にいる中核チームは、阿里淘天グループの「未来生活実験室」であり、前快手副総裁で可灵技術責任者の张迪が率いている。

公開情報によれば、张迪は2025年底に阿里へ加盟し、淘天グループの「未来生活実験室」を統括している。同実験室は阿里電商の中核アルゴリズムチームで、トップクラスの技術人材とコア計算リソースを集結させており、大規模モデルおよび多モーダルの最先端領域に注力している。設立からわずか1年あまりで、国際的なトップ会議に10本以上の高品質論文を発表している。

付け加えておくと、この噂が膨らみ始めたタイミングは、ちょうど阿里香港株の今日の活発な値動きと重なっている——もちろん、これは面白い偶然にすぎず、現時点では両者を直接結びつける確かな裏付けはなく、過度に解釈すべきではない。

この件で本当に重要なシグナル

HappyHorseが最終的に誰の手に渡るとしても、この出来事が伝える業界のシグナルはすでに十分に明確だ。

長年にわたり、オープンソースの動画モデルとクローズド製品の間には、効果面での“見える差”が横たわってきた。顧客に納品する必要があるシーンでは、オープンソースモデルの生成品質は常に「使える」から「納品できる」までのハードルを越えられずにいた。可灵やSeedanceなどのクローズド製品の価格決定力が、相当程度この差の上に築かれているのはそのためだ。

今回は、オープンソースモデルをベースにしたプロダクトが、実際のユーザーの体感を基準とする盲検ランキングにおいて、初めて現在の主流クローズド競合相手と真正面から肩を並べた。

この差を根拠に価格決定力を構築してきたクローズド事業者にとって、これは少なくとも真剣に受け止めるべきシグナルだ。

Artificial Analysisの「盲検でトップ独占」慣例に従えば、匿名モデルが注目を十分に集めた後、公式側は通常1週間以内に正式に「認め取り」(引き取り)を行う。

おそらく、ここ数日で答えが分かるだろう。

この馬年において、本当に注目すべきなのは、どの馬がいちばん速く走るかではなく、レースのコースそのものが広がってきていることなのかもしれない。

リスク提示および免責条項

        市場にはリスクがあるため、投資は慎重に行ってください。この記事は個人の投資助言を構成するものではなく、特定のユーザーの特殊な投資目標、財務状況、またはニーズについても考慮していません。ユーザーは、この記事内のあらゆる意見、見解、結論が自身の特定状況に適合するかどうかを検討してください。これに基づいて投資する場合は自己責任となります。
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • 人気の Gate Fun

    もっと見る
  • 時価総額:$2.26K保有者数:1
    0.00%
  • 時価総額:$2.25K保有者数:1
    0.00%
  • 時価総額:$2.26K保有者数:1
    0.00%
  • 時価総額:$2.27K保有者数:1
    0.00%
  • 時価総額:$2.29K保有者数:2
    0.00%
  • ピン