NVIDIA Cosmos 3 Mô hình thế giới AI vật lý chính thức mở tải xuống hôm nay, hai phiên bản đã có trên HuggingFace

Tin tức từ Trang web lĩnh vực tiền tệ, Nvidia chính thức mở tải trọng số mô hình thế giới AI vật lý Cosmos 3 hôm nay, phát hành lần đầu hai phiên bản super (646 tỷ tham số) và nano (157 tỷ tham số), đều đã có trên HuggingFace (không giới hạn truy cập, có thể tải xuống trực tiếp) và build.nvidia.com, đồng thời hỗ trợ triển khai dưới dạng dịch vụ vi NIM của NVIDIA. Cosmos 3 được định vị là mô hình nền tảng thế giới đa mô thức (omnimodel) dành cho AI vật lý, dựa trên kiến trúc Transformer lai mới (mixture of transformers), hiểu và sinh ra văn bản, hình ảnh, video, âm thanh môi trường và hành động một cách tự nhiên. Phiên bản super hướng tới các mô hình robot hậu huấn luyện và tự lái cần độ chính xác vật lý cao nhất, phiên bản nano dành cho các cảnh suy luận video chất lượng cao và hành động với độ trễ thấp. Ngoài ra, phiên bản edge (hướng tới suy luận thời gian thực tại biên) dự kiến sẽ ra mắt trong thời gian tới. Nvidia cho biết Cosmos 3 là "mô hình đa mô thức hoàn toàn mở đầu tiên trên thế giới", các nhà phát triển có thể tự do tải xuống, hậu huấn luyện và chuyển đổi thành mô hình sở hữu riêng.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 8
  • 2
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
OwlChainViewer
· 3giờ trước
Kiến trúc Transformer hỗn hợp có chút gì đó, hiểu thống nhất đa mô hình cuối cùng không còn là chuyện mơ hồ nữa
Xem bản gốcTrả lời0
Stop-LossInTheEveningGlow
· 3giờ trước
Đội chờ đợi đã thắng lớn, những tin đồn về quy mô tham số trước đó hóa ra là đúng thật
Xem bản gốcTrả lời0
SlowerThanBlock
· 4giờ trước
Mô hình thế giới AI vật lý + không điều khiển, các công ty lớn khác có theo không? Không theo thì sẽ bị tụt lại phía sau
Xem bản gốcTrả lời0
GateUser-470bc925
· 4giờ trước
Tham số chênh lệch gấp bốn lần, sự đánh đổi giữa độ chính xác và hiệu quả, chọn dao phù hợp theo từng tình huống
Xem bản gốcTrả lời0
NeonFusionIceCream
· 4giờ trước
cách pha trộn hỗn hợp của các bộ biến đổi cụ thể như thế nào, chờ các bài blog kỹ thuật phân tích
Xem bản gốcTrả lời0
QuantsAndCats
· 4giờ trước
Huấn luyện sau tự lái dùng super, tạo video dùng nano, phân công rõ ràng
Xem bản gốcTrả lời0
L2ArbitrageYoungster
· 4giờ trước
Nhiều người chưa chú ý đến việc hỗ trợ nguyên bản âm thanh môi trường, cuối cùng đa phương thức cũng đã mang đến trải nghiệm nghe.
Xem bản gốcTrả lời0
ArbitrageIsn'tAsGoodAsGetting
· 4giờ trước
Việc triển khai dịch vụ vi mô NIM rất thân thiện với các doanh nghiệp nhỏ và vừa, không cần tự xây dựng hạ tầng phức tạp.
Xem bản gốcTrả lời0
  • Đã ghim