NVIDIA NeMo RL hỗ trợ huấn luyện tăng cường học với độ chính xác thấp FP8, tăng tốc quá trình lặp lại của các tác nhân thông minh

robot
Đang tạo bản tóm tắt
ME News 消息,4 月 23 日(UTC+8),NVIDIA AI 近日宣布,其开源库 NVIDIA NeMo RL 新增了一项能力,支持使用低精度 FP8 格式进行强化学习(RL)后训练,以加速相关计算工作负载。根据其发布的信息,在 Qwen3-8B-Base 模型上,使用 FP8 格式可将 RL 工作负载的速度提升 1.48 倍。这一加速旨在为智能体的工具使用和多步骤任务实现更快的迭代周期。(来源:InFoQ)
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim