NVIDIA NeMo RL hỗ trợ huấn luyện tăng cường học với độ chính xác thấp FP8, tăng tốc quá trình lặp lại của các tác nhân thông minh

robot
Đang tạo bản tóm tắt
ME News Tin tức, ngày 23 tháng 4 (UTC+8), NVIDIA AI gần đây đã công bố rằng thư viện mã nguồn mở NVIDIA NeMo RL đã bổ sung một khả năng mới, hỗ trợ sử dụng định dạng FP8 độ chính xác thấp để huấn luyện lại học tăng cường (RL), nhằm tăng tốc các công việc tính toán liên quan. Theo thông tin họ công bố, trên mô hình Qwen3-8B-Base, việc sử dụng định dạng FP8 có thể tăng tốc độ của công việc RL lên 1,48 lần. Đợt tăng tốc này nhằm mục đích tạo ra chu kỳ lặp lại nhanh hơn cho việc sử dụng công cụ của tác nhân và thực hiện các nhiệm vụ nhiều bước. (Nguồn: InFoQ)
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim