NVIDIA NeMo RL hỗ trợ học tăng cường độ chính xác thấp FP8 sau huấn luyện, tăng tốc lặp lại tác nhân.

robot
Đang tạo bản tóm tắt
ME News tin tức, ngày 23 tháng 4 (UTC+8), NVIDIA AI gần đây đã thông báo rằng thư viện mã nguồn mở NVIDIA NeMo RL của họ đã bổ sung khả năng mới, hỗ trợ sử dụng định dạng FP8 độ chính xác thấp để huấn luyện sau (RL) nhằm tăng tốc khối lượng công việc tính toán liên quan. Theo thông tin được công bố, trên mô hình Qwen3-8B-Base, việc sử dụng định dạng FP8 có thể tăng tốc độ khối lượng công việc RL lên 1,48 lần. Sự tăng tốc này nhằm mang lại chu kỳ lặp nhanh hơn cho việc sử dụng công cụ của tác nhân và các tác vụ đa bước. (Nguồn: InFoQ)
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim