Benchmark LongCat rất thú vị, tách biệt giữa kiểm soát và hiển thị, hy-world1.5 điều hướng mạnh mẽ, tính nhất quán của lingbot-world ổn định, matrix-game3.0 điều hướng hành động song hành, mỗi bên có sở trường riêng, cạnh tranh là điều tốt cho nhà phát triển.

Xem bản gốc
CoinNetwork
Đại học Phục Đán hợp tác cùng Meituan LongCat mở nguồn chuẩn mô hình thế giới tương tác WBench
Phục Đán và Meituan LongCat hợp tác mở nguồn chuẩn mô hình thế giới tương tác WBench, gồm 289 trường hợp thử nghiệm, 1058 lượt tương tác, bao gồm góc nhìn thứ nhất và thứ hai, điều khiển định hướng, hành động chủ thể, chỉnh sửa sự kiện và chuyển đổi góc nhìn. 22 chỉ số tự động và hệ số liên quan đến kiểm tra mù của con người ≥0.94. Kết quả cho thấy điều khiển tương tác và mô hình hiển thị, vật lý/đồng nhất gần như tách rời, hy-world1.5 dẫn đầu trong điều khiển định hướng, lingbot-world dẫn đầu về tính nhất quán, matrix-game3.0 đứng đầu về hành động và định hướng.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim