HappyHorse atteint anonymement le sommet du test à l'aveugle de vidéos IA, Alibaba TaoTian et Sand.ai sont tous deux suspectés

robot
Création du résumé en cours

D’après la surveillance de 1M AI News, un modèle anonyme nommé HappyHorse-1.0 a pris la première place la semaine dernière sur la plateforme d’évaluation vidéo d’IA Artificial Analysis, dans le classement Video Arena. Il a remporté simultanément la première place sur les deux filières (catégories sans audio) : génération de vidéos à partir de texte et génération de vidéos à partir d’images. Il a ainsi évincé Seedance 2.0, qui a été classé deuxième. Dans les catégories avec audio, Seedance 2.0 reste néanmoins en tête avec un léger avantage. Aucune conférence de presse, aucun blog technique, aucune mention de l’entreprise. À ce jour, personne ne l’a publiquement revendiqué.

Le classement de Video Arena repose sur un système de tests à l’aveugle basé sur Elo : les utilisateurs votent pour la meilleure de deux vidéos générées sans connaître l’identité du modèle. La durée de présence de HappyHorse dans le classement est relativement courte : l’échantillon compte environ 3500 tests, soit moins de la moitié de celui de Seedance 2.0. L’intervalle de confiance est donc plus large (±12-13 points). Cependant, l’avance de HappyHorse sur la filière sans audio (environ 76 points pour la génération de vidéos à partir de texte, et environ 48 points pour la génération de vidéos à partir d’images) demeure très supérieure à la marge d’erreur.

D’après l’ordre des langues sur le site officiel (le chinois et le cantonais avant l’anglais) et le mème « HappyHorse » associé à l’année 2026 du cheval, les acteurs du secteur estiment que le modèle provient d’une équipe chinoise. Deux explications principales :

  1. Plusieurs médias spécialisés du secteur affirment que le modèle provient du laboratoire Future Life de l’unité Taotian du groupe Alibaba, dirigé par Zhang Di. Zhang Di a auparavant été vice-président technique chez Kuaishou. Depuis 2024, il dirige le développement de l’IA Keling, et en avril 2025, il publie Keling 2.0 Master. La même année, en novembre, il retourne chez Alibaba
  2. L’utilisateur X Vigo Zhao, après avoir comparé point par point, a constaté que HappyHorse correspond exactement, sur plusieurs indicateurs de référence, au daVinci-MagiHuman, que la startup d’IA vidéo Sand.ai a open-sourcé en mars de cette année. La structure du site officiel est également très similaire. Sand.ai a été fondée par Cao Yue, premier auteur de Swin Transformer, et est surnommée dans l’industrie « le DeepSeek de l’IA vidéo »

Le site officiel de HappyHorse indique que le modèle compte 15 milliards de paramètres, 40 couches de Transformer avec attention, et utilise une architecture Transfusion (qui traite de manière unifiée dans le même modèle la prédiction auto-régressive du texte et la génération par diffusion des vidéos et de l’audio). Il effectue l’inférence en 8 étapes, produit des vidéos en 1080p avec audio synchronisé, prend en charge la synchronisation des lèvres dans sept langues (chinois, anglais, japonais, coréen, allemand, français et cantonais), est entièrement open source et autorise un usage commercial.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler