HappyHorse đứng đầu cuộc thi thử nghiệm video AI ẩn danh, Alibaba's Taotian và Sand.ai đang bị điều tra

robot
Đang tạo bản tóm tắt

Theo báo cáo giám sát của 1M AI News, một mô hình ẩn danh tên HappyHorse-1.0 đã đứng đầu bảng xếp hạng Video Arena trên nền tảng đánh giá video AI Artificial Analysis vào tuần trước, giành vị trí số 1 ở cả hai hạng mục text-to-video và image-to-video (loại trừ audio). Điều này đẩy Seedance 2.0 của ByteDance xuống vị trí thứ hai. Ở hạng mục âm thanh, Seedance 2.0 vẫn dẫn trước với khoảng cách hẹp. Chưa có họp báo, không có bài blog kỹ thuật, không có gán nguồn cho công ty, và cũng chưa ai công khai nhận trách nhiệm cho đến nay. Bảng xếp hạng Video Arena được xây dựng dựa trên hệ thống blind testing Elo, trong đó người dùng bình chọn cho video họ thích hơn trong hai lựa chọn được tạo ra mà không biết danh tính của mô hình. HappyHorse xuất hiện trong danh sách trong thời gian ngắn, với cỡ mẫu khoảng 3,500, ít hơn nửa so với Seedance 2.0, dẫn đến khoảng tin cậy rộng (±12-13 điểm). Tuy nhiên, mức dẫn trước ở hạng mục không có âm thanh (khoảng 76 điểm cho text-to-video và khoảng 48 điểm cho image-to-video) vượt xa sai số. Dựa trên thứ tự ngôn ngữ trên trang web chính thức (với tiếng Trung và tiếng Quảng được liệt kê trước tiếng Anh) và tham chiếu “HappyHorse” tới Năm Ngựa trong năm 2026, các nhà trong ngành suy đoán rằng mô hình này xuất phát từ một nhóm tại Trung Quốc. Có hai giả thuyết phổ biến: 1. Một số cơ quan truyền thông trong ngành cho rằng mô hình đến từ Future Life Lab thuộc Taotian Group của Alibaba, do Zhang Di dẫn dắt; trước đó, ông từng giữ chức Phó Chủ tịch Công nghệ tại Kuaishou và sẽ dẫn dắt sự phát triển của Keling AI bắt đầu từ năm 2024, với kế hoạch phát hành Keling 2.0 Master Edition vào tháng 4/2025. Vào tháng 11 của cùng năm, ông sẽ quay lại Alibaba. 2. User Vigo Zhao đã tiến hành so sánh chi tiết và phát hiện rằng HappyHorse khớp hoàn toàn với nhiều chỉ số benchmark của daVinci-MagiHuman, dự án đã được công bố mã nguồn mở bởi startup video AI Sand.ai vào tháng 3 năm nay, và cấu trúc của các trang web chính thức cũng có mức độ tương đồng rất cao. Sand.ai được thành lập bởi Cao Yue, tác giả đầu tiên của Swin Transformer, và trong ngành được gọi là “DeepSeek của AI video.” Trang web chính thức của HappyHorse cho biết mô hình có 15Bỷ tham số, 40 lớp self-attention transformers, sử dụng kiến trúc Transfusion (kết hợp dự đoán autoregressive văn bản và tạo sinh khuếch tán âm thanh video trong cùng một mô hình), có suy luận 8 bước, xuất video 1080p với âm thanh được đồng bộ, và hỗ trợ lip-sync ở bảy ngôn ngữ: tiếng Trung, tiếng Anh, tiếng Nhật, tiếng Hàn, tiếng Đức, tiếng Pháp và tiếng Quảng. Nó hoàn toàn là mã nguồn mở và cho phép sử dụng thương mại.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Gate Fun hot

    Xem thêm
  • Vốn hóa:$2.29KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.36KNgười nắm giữ:2
    0.29%
  • Vốn hóa:$0.1Người nắm giữ:1
    0.00%
  • Vốn hóa:$2.29KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.32KNgười nắm giữ:2
    0.00%
  • Ghim