Ngựa vui vẻ bí ẩn đột nhiên xuất hiện và thống trị bảng xếp hạng, nghiền nát Seedance 2.0, AI video lại thay đổi cục diện rồi sao?

robot
Đang tạo bản tóm tắt

Thứ Ba đêm khuya, cộng đồng AI nổ tung.

Trên bảng xếp hạng Video Arena của nền tảng đánh giá AI Artificial Analysis nổi tiếng toàn cầu, một mô hình tạo video sinh ra bí ẩn với mã hiệu 「HappyHorse-1.0」 bất ngờ nhảy vọt lên—không họp ra mắt, không blog kỹ thuật, không có bất kỳ sự bảo chứng nào từ công ty, thế nhưng trực tiếp vươn lên ngôi đầu với tư thế áp đảo.

Tính đến thời điểm đăng bài, trong hạng mục video sinh văn bản, điểm Elo tăng vọt lên 1357 điểm, vượt 84 điểm so với Seedance 2.0, mô hình mới đăng quang được năm ngày; đồng thời hơn hơn 100 điểm so với hạng ba và hạng bốn là SkyReels V4 và Kling 3.0 1080p Pro. HappyHorse-1.0 chỉ bằng một mô hình đã kéo giãn khoảng cách giữa cả bậc thang của ngành.

Hạng mục tạo video từ hình ảnh thậm chí còn đạt điểm số kinh khủng 1402, phá kỷ lục lịch sử của bảng xếp hạng này.

Điểm duy nhất có phần kém hơn là trong bảng xếp hạng tổng hợp 「video + âm thanh」 có âm thanh gốc, HappyHorse xếp thứ hai, thấp hơn một chút so với Seedance 2.0.

Bảng xếp hạng này, không dễ gì quét điểm

Phần lớn mọi người phản ứng đầu tiên là: Liệu đây có phải là quét điểm không?

Sự nghi ngờ này cũng không phải là không có cơ sở. Nhưng cơ chế xếp hạng của Artificial Analysis lại khiến cho nó khó bị thao túng một cách dễ dàng hơn so với các bảng điểm chạy phổ thông—tất cả thứ hạng đều đến từ lá phiếu thử nghiệm mù 「chọn 1 trong 2 khi bị che mắt」 của người dùng thực sự trên toàn cầu. Người dùng hoàn toàn không biết gì, sẽ so sánh và chọn lựa giữa hai kết quả sinh ra; cuối cùng, chúng được tổng hợp thành điểm Elo.

Đội ngũ mô hình không thể gian lận bằng cách “làm đề”, phản ánh rằng đó là lựa chọn cảm nhận chân thực nhất của người bình thường sau khi xem.

Tất nhiên, cũng có người chỉ ra rằng trong các mẫu thử mù của Artificial Analysis, tỷ lệ nội dung tạo hình nhân vật và nội dung dạng đọc lời/đọc thoại chiếm hơn 60%, và vì HappyHorse có lợi thế bẩm sinh trong các bối cảnh tạo hình nhân vật, nên ở một mức độ nào đó có thể tạo ra chênh lệch giữa điểm đánh giá và năng lực tổng hợp thực tế.

Trên X, vì thế cuộc thảo luận cũng chia thành hai phe: phe hoài nghi cho rằng HappyHorse và Seedance 2.0 vẫn còn khác biệt nhìn thấy được ở chi tiết nhân vật và tính liền mạch động; phe ủng hộ thì đặt kỳ vọng lớn vào tiềm năng của nó, đặc biệt là mong có thể giải quyết điểm đau của ngành về tính nhất quán chất lượng trong các chuỗi nhiều cảnh quay.

Thứ hai, theo các bài đánh giá trên mạng, người dùng bình thường nhìn chung đánh giá rất cao mô hình này.

“HappyHorse” rốt cuộc là ngựa của ai?

Đây mới là câu hỏi mà toàn bộ cộng đồng AI muốn làm rõ nhất.

Những suy đoán trên X đến rất nhanh. Điều được chú ý đầu tiên là thứ tự ngôn ngữ trên trang web chính thức: Tiếng phổ thông và tiếng Quảng Đông đứng trước tiếng Anh. Với một sản phẩm hướng tới người dùng toàn cầu, thứ tự này khá bất thường—hậu trường đội ngũ đến từ Trung Quốc, cơ bản có thể xác nhận.

Ngay bản thân cái tên cũng là một manh mối. Năm 2026 là năm Ngọ theo lịch âm, nên cách đặt tên 「HappyHorse」 cài cắm một trò chơi chữ theo kiểu khá không giấu giếm về năm Ngọ; trước đó vào đầu năm,「Pony Alpha」 cũng đã từng chơi kiểu tương tự. Vì vậy danh sách nghi phạm nhanh chóng được mở rộng: người sáng lập Tencent và Alibaba đều họ Mã, nên tự nhiên nằm trong danh sách; có người đặt cược vào Xiaomi, cho rằng Lôi Quân luôn kín tiếng, thích “bật bài” đột ngột; cũng có người cảm thấy khí chất giống DeepSeek hơn, vì DS trước đó từng lặng lẽ cho ra mắt một mô hình thị giác, rồi sau đó lại lặng lẽ gỡ xuống.

Bình luận của người dùng X Passluo mang ý nghĩa khá sâu xa: “Người cưỡi con ngựa vui này là ai vậy? Alibaba, Tencent hay Xiaomi?”

Bóc tách theo góc độ kỹ thuật

Chỉ dựa vào tên thì không đủ, giới kỹ thuật ngay lập tức chuyển sang chế độ Sherlock.

Người dùng X Vigo Zhao lấy dữ liệu bộ chuẩn công khai của HappyHorse-1.0 đem đối chiếu từng mục với các mô hình đã biết, và tìm được một đối tượng khớp đến mức rất cao: daVinci-MagiHuman—tức là mô hình mã nguồn mở 「đại nhân loại pháp sư daVinci」 đã ra mắt trên GitHub vào tháng 3 năm nay.

Dữ liệu về chất lượng hình ảnh, căn chỉnh văn bản, tính nhất quán vật lý… đều khớp từng hạng mục, cấu trúc trang web chính thức cũng gần như giống nhau. Cả hai đều là kiến trúc Transformer một luồng, cùng hỗ trợ sinh ra video và âm thanh kết hợp, danh sách ngôn ngữ hỗ trợ hoàn toàn nhất quán. Mức độ trùng hợp này rất khó để giải thích bằng tình cờ.

Kết luận hiện được giới kỹ thuật công nhận ở mức cao là: HappyHorse là một trong những bên phát triển phối hợp cùng daVinci-MagiHuman, cụ thể là Sand.ai—bản phiên bản được tối ưu theo mô hình mã nguồn mở thông qua các vòng lặp. Mục tiêu cốt lõi là kiểm chứng giới hạn hiệu năng của mô hình dưới sở thích thật sự của người dùng, làm nền tảng cho các lần triển khai thương mại tiếp theo.

daVinci-MagiHuman được công bố mã nguồn mở chính thức vào ngày 23 tháng 3 năm 2026. Đây là sản phẩm hợp tác của hai đội nhóm trẻ:

Một đội đến từ Phòng thí nghiệm nghiên cứu AI tạo sinh của Học viện Chuangzhi Thượng Hải; đội còn lại là Sand.ai tại Bắc Kinh (ba cự Khoa học và Công nghệ). Mô hình sử dụng Transformer một luồng thuần tự chú ý với 15Bỷ tham số, nhét toàn bộ token của ba mô thức văn bản, video và âm thanh vào cùng một chuỗi để mô hình hóa chung.

Một manh mối khác, chỉ về Taobao của Alibaba

Trong lúc đó, ngoài thị trường cũng lan truyền một phiên bản dự đoán khác:

Đội ngũ cốt lõi đứng sau HappyHorse đến từ “Phòng thí nghiệm cuộc sống tương lai” thuộc tập đoàn Taobao của Alibaba, do Trương Đì—cựu Phó tổng giám đốc của Kuaishou kiêm người phụ trách công nghệ Keleng—đứng đầu.

Tài liệu công khai cho thấy, Trương Đì gia nhập Alibaba vào cuối năm 2025 và nắm quyền “Phòng thí nghiệm cuộc sống tương lai” thuộc tập đoàn Taobao. Phòng thí nghiệm này là đội ngũ thuật toán lõi của Alibaba trong mảng thương mại điện tử, tập hợp nhân tài công nghệ hàng đầu và nguồn lực tính toán cốt lõi, tập trung vào lĩnh vực mô hình lớn và các tiên phong đa phương thức. Mới thành lập hơn một năm, đã công bố hơn 10 bài báo chất lượng cao tại các hội nghị quốc tế hàng đầu.

Đáng chú ý, mốc thời gian mà tin đồn này bắt đầu lan rộng lại trùng đúng với việc Alibaba trên thị trường chứng khoán Hồng Kông có diễn biến sôi động—đương nhiên, đây chỉ là một sự trùng hợp thú vị; hiện chưa có bất kỳ bằng chứng xác thực nào cho thấy hai bên có liên quan trực tiếp, nên không nên diễn giải quá đà.

Tín hiệu quan trọng thật sự của chuyện này

Dù cuối cùng HappyHorse rơi vào tay ai, thì tín hiệu ngành mà sự kiện lần này truyền đi đã đủ rõ ràng.

Trong thời gian dài, giữa mô hình video mã nguồn mở và sản phẩm đóng nguồn luôn tồn tại một khoảng cách có thể nhìn thấy về mặt hiệu quả—ở những tình huống cần bàn giao cho khách hàng, chất lượng sinh của mô hình mã nguồn mở vẫn luôn chưa thể vượt qua ngưỡng từ “có thể dùng” đến “có thể bàn giao”. Quyền định giá của các sản phẩm đóng nguồn như Keleng, Seedance… ở một mức độ đáng kể chính là được xây dựng trên khoảng cách này.

Lần này, một sản phẩm dựa trên mô hình mã nguồn mở lần đầu tiên sánh vai trực diện các đối thủ đóng nguồn chủ đạo hiện tại trên bảng xếp hạng thử nghiệm mù lấy cảm nhận người dùng thực làm chuẩn.

Đối với các nhà sản xuất đóng nguồn dựa vào khoảng cách đó để xây dựng quyền định giá, đây ít nhất cũng là một tín hiệu đáng để nghiêm túc cân nhắc.

Theo “thông lệ quét bảng” thử nghiệm mù của Artificial Analysis, khi một mô hình ẩn danh thu hút đủ sự chú ý, thông thường phía chính thức sẽ trong vòng một tuần chính thức “nhận diện”.

Có lẽ ngay trong vài ngày tới, chúng ta sẽ biết câu trả lời.

Trong năm Ngọ này, có lẽ điều đáng chú ý thực sự không phải là con ngựa nào chạy nhanh nhất, mà là chính đường đua—đang được mở rộng.

Cảnh báo rủi ro và điều khoản miễn trừ trách nhiệm

        Thị trường có rủi ro, đầu tư cần thận trọng. Bài viết này không cấu thành lời khuyên đầu tư cá nhân, và cũng chưa cân nhắc đến các mục tiêu đầu tư đặc biệt của từng người dùng, tình hình tài chính hoặc nhu cầu cụ thể. Người dùng nên cân nhắc liệu bất kỳ ý kiến, quan điểm hoặc kết luận nào trong bài viết này có phù hợp với tình trạng cụ thể của mình hay không. Đầu tư theo đó, tự chịu trách nhiệm.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim