HappyHorse переміг у AI відео-бліц-тесті анонімно, під слідством опинилися Taotian від Alibaba та Sand.ai

robot
Генерація анотацій у процесі

За моніторингом 1M AI News, анонімна модель на ім’я HappyHorse-1.0 минулого тижня очолила рейтинг Video Arena на платформі оцінювання AI-відео Artificial Analysis, здобувши перше місце в обох категоріях text-to-video та image-to-video (без аудіо). Це відсунуло Seedance 2.0 від ByteDance на друге місце. У аудіокатеґорії Seedance 2.0, як і раніше, лідирує з дуже незначним відривом. Не було пресконференції, технічного блогу, немає вказівки на компанію, і станом на сьогодні ніхто публічно ще не заявив про це. Рейтинг Video Arena ґрунтується на системі сліпого тестування Elo, де користувачі голосують за відео, яке їм більше подобається, з двох варіантів, згенерованих без знання ідентичності моделі. HappyHorse перебуває в переліку недовго: обсяг вибірки становить приблизно 3,500, тобто менше ніж половина Seedance 2.0, через що формується широкий довірчий інтервал (±12-13 пунктів). Однак відрив у безаудіо-категорії (приблизно 76 пунктів для text-to-video та близько 48 пунктів для image-to-video) значно перевищує межу похибки. Ґрунтуючись на порядку мов на офіційному вебсайті (де китайська та кантонська вказані перед англійською) і на посиланні «HappyHorse» на Рік Коня у 2026, інсайдери галузі припускають, що модель походить із китайської команди. Є дві основні теорії:

  1. Декілька профільних медіа стверджують, що модель походить із Future Life Lab групи Taotian від Alibaba, яку очолює Zhang Di; раніше він обіймав посаду віцепрезидента з технологій у Kuaishou, а з 2024 року керуватиме розробкою Keling AI, при цьому запланований реліз Keling 2.0 Master Edition — на квітень 2025 року. У листопаді того самого року він повернеться до Alibaba.

  2. User Vigo Zhao провів детальне порівняння і виявив, що HappyHorse повністю відповідає кільком показникам бенчмарків daVinci-MagiHuman, який AI-відеостартап Sand.ai у березні цього року відкрив у вигляді open-source, а структура офіційних вебсайтів також є дуже схожою. Sand.ai було засновано Cao Yue, першим автором Swin Transformer, і в галузі його називають «DeepSeek of AI video». Офіційний вебсайт HappyHorse вказує, що модель має 15 мільярдів параметрів, 40 шарів трансформерів із self-attention, використовує архітектуру Transfusion (яка об’єднує текстове автогенеративне передбачення та відео- аудіо дифузійне генерування в межах тієї самої моделі), має 8-кроковий inference, виводить відео у 1080p із синхронізованим аудіо та підтримує lip-sync сімома мовами: Chinese, English, Japanese, Korean, German, French і Cantonese. Вона повністю відкрита як open-source і дозволяє комерційне використання.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Популярні активності Gate Fun

    Дізнатися більше
  • Рин. кап.:$2.23KХолдери:1
    0.00%
  • Рин. кап.:$2.22KХолдери:1
    0.00%
  • Рин. кап.:$2.22KХолдери:1
    0.00%
  • Рин. кап.:$2.23KХолдери:1
    0.00%
  • Рин. кап.:$0.1Холдери:0
    0.00%
  • Закріпити