NVIDIA phát hành mã nguồn mở mô hình AI tháp đôi, tốc độ tạo văn bản tăng 2.42 lần, chất lượng hình ảnh giữ lại 98.7%

ME AI Tin tức, NVIDIA phát hành mô hình ngôn ngữ khuếch tán rời rạc Nemotron-Labs-TwoTower, giải quyết vấn đề tốc độ sinh token chậm của mô hình lớn, trọng số đã được mã nguồn mở trên Huggingface. Mô hình này tái sử dụng trọng số tiền huấn luyện của mạng xương sống hiện có, không cần huấn luyện lại từ đầu, giảm đáng kể chi phí. Sử dụng kiến trúc hai tháp 60B, hai mạng 30B hoạt động song song và cộng tác, mỗi tháp kích hoạt tham số 3B và được trang bị 128 mô-đun chuyên gia có thể định tuyến, nâng cao hiệu suất sinh. (Nguồn: MLion)
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim