NVIDIA NeMo RL 支持 FP8 低精度强化学习后训练,加速智能体迭代

robot
摘要生成中
ME News 消息,4 月 23 日(UTC+8),NVIDIA AI 近日宣布,其开源库 NVIDIA NeMo RL 新增了一项能力,支持使用低精度 FP8 格式进行强化学习(RL)后训练,以加速相关计算工作负载。根据其发布的信息,在 Qwen3-8B-Base 模型上,使用 FP8 格式可将 RL 工作负载的速度提升 1.48 倍。这一加速旨在为智能体的工具使用和多步骤任务实现更快的迭代周期。(来源:InFoQ)
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论