NVIDIA NeMo RL suporta treinamento posterior de aprendizado por reforço de baixa precisão FP8, acelerando a iteração do agente.

robot
Geração do resumo em andamento
ME News消息,4月23日(UTC+8),NVIDIA AI近日宣布,其开源库NVIDIA NeMo RL新增了一项能力,支持使用低精度FP8格式进行强化学习(RL)后训练,以加速相关计算工作负载。根据其发布的信息,在Qwen3-8B-Base模型上,使用FP8格式可将RL工作负载的速度提升1.48倍。这一加速旨在为智能体的工具使用和多步骤任务实现更快的迭代周期。(来源:InFoQ)
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários