HappyHorse Menang Blind Test Video AI Secara Anonim, Taotian Alibaba dan Sand.ai Dalam Pengawasan

robot
Pembuatan abstrak sedang berlangsung

Menurut pemantauan oleh 1M AI News, sebuah model anonim bernama HappyHorse-1.0 memuncaki peringkat Video Arena di platform penilaian video AI Artificial Analysis minggu lalu, meraih posisi pertama di kategori text-to-video dan image-to-video (tidak termasuk audio). Ini mendorong Seedance 2.0 dari ByteDance ke posisi kedua. Di kategori audio, Seedance 2.0 masih memimpin dengan selisih tipis. Tidak ada konferensi pers, tidak ada blog teknis, dan tidak ada atribusi perusahaan, serta belum ada siapa pun yang mengklaimnya secara publik. Peringkat Video Arena didasarkan pada sistem pengujian buta Elo, di mana pengguna memilih video pilihan mereka dari dua opsi yang dihasilkan tanpa mengetahui identitas modelnya. HappyHorse masuk daftar untuk waktu yang singkat, dengan ukuran sampel sekitar 3.500, yang kurang dari setengah Seedance 2.0, sehingga menghasilkan interval kepercayaan yang lebar (±12-13 poin). Namun, keunggulan di kategori tanpa audio (sekitar 76 poin untuk text-to-video dan sekitar 48 poin untuk image-to-video) jauh melampaui margin kesalahan. Berdasarkan urutan bahasa di situs resmi (dengan bahasa Tionghoa dan Kanton tercantum sebelum bahasa Inggris) dan rujukan ‘HappyHorse’ pada Tahun Kuda pada 2026, para pelaku industri berspekulasi bahwa model ini berasal dari tim Tiongkok. Ada dua teori arus utama: 1. Beberapa media industri mengklaim model ini berasal dari Future Life Lab milik Alibaba, yang dipimpin Zhang Di, yang sebelumnya menjabat sebagai Wakil Presiden Teknologi di Kuaishou dan akan memimpin pengembangan Keling AI mulai 2024, dengan rencana rilis Keling 2.0 Master Edition pada April 2025. Pada November tahun yang sama, ia akan kembali ke Alibaba. 2. Vigo Zhao dari pihak pengguna melakukan perbandingan terperinci dan menemukan bahwa HappyHorse sepenuhnya cocok dengan beberapa indikator tolok ukur dari daVinci-MagiHuman, yang dibuka sumbernya oleh startup video AI Sand.ai pada bulan Maret tahun ini, dan struktur situs web resminya juga sangat mirip. Sand.ai didirikan oleh Cao Yue, penulis pertama Swin Transformer, dan di kalangan industri disebut sebagai ‘DeepSeek dari video AI.’ Situs web resmi HappyHorse menunjukkan bahwa model ini memiliki 15 miliar parameter, 40 lapisan transformer self-attention, menggunakan arsitektur Transfusion (yang menyatukan prediksi autoregresif teks dan generasi difusi audio video dalam model yang sama), memiliki inferensi 8 langkah, menghasilkan video 1080p dengan audio yang tersinkron, serta mendukung lip-sync dalam tujuh bahasa: Tionghoa, Inggris, Jepang, Korea, Jerman, Prancis, dan Kanton. Model ini sepenuhnya open-source dan mengizinkan penggunaan komersial.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan