NVIDIA NeMo RL prend en charge le post-entraînement par renforcement à faible précision FP8, accélérant l'itération des agents.

robot
Création du résumé en cours

ME News 消息,4 月 23 日(UTC+8),NVIDIA AI 近日宣布,其开源库 NVIDIA NeMo RL 新增了一项能力,支持使用低精度 FP8 格式进行强化学习(RL)后训练,以加速相关计算工作负载。根据其发布的信息,在 Qwen3-8B-Base 模型上,使用 FP8 格式可将 RL 工作负载的速度提升 1.48 倍。这一加速旨在为智能体的工具使用和多步骤任务实现更快的迭代周期。(来源:InFoQ)

Traduction en français :
ME News, le 23 avril (UTC+8), NVIDIA AI a récemment annoncé que sa bibliothèque open source NVIDIA NeMo RL a ajouté une capacité prenant en charge l'utilisation du format de faible précision FP8 pour le post-entraînement par apprentissage par renforcement (RL), afin d'accélérer les charges de travail de calcul associées. Selon les informations publiées, sur le modèle Qwen3-8B-Base, l'utilisation du format FP8 permet d'accélérer les charges de travail RL d'un facteur 1,48. Cette accélération vise à permettre des cycles d'itération plus rapides pour l'utilisation d'outils par les agents et les tâches en plusieurs étapes. (Source : InFoQ)

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé