NVIDIA NeMo RL hỗ trợ huấn luyện sau học tăng cường độ chính xác thấp FP8, tăng tốc vòng lặp của tác nhân.

robot
Đang tạo bản tóm tắt
ME News tin tức, ngày 23 tháng 4 (UTC+8), NVIDIA AI gần đây thông báo rằng thư viện mã nguồn mở NVIDIA NeMo RL của họ đã bổ sung một khả năng mới, hỗ trợ sử dụng định dạng FP8 độ chính xác thấp để huấn luyện tăng cường (RL) sau đó, nhằm tăng tốc khối lượng công việc tính toán liên quan. Theo thông tin công bố, trên mô hình Qwen3-8B-Base, việc sử dụng định dạng FP8 có thể tăng tốc độ khối lượng công việc RL lên 1,48 lần. Việc tăng tốc này nhằm mục đích cung cấp các chu kỳ lặp nhanh hơn cho việc sử dụng công cụ của tác nhân và các nhiệm vụ đa bước. (Nguồn: InFoQ)
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim