NVIDIA NeMo RL prend en charge l'apprentissage par renforcement à faible précision FP8, accélérant l'itération des agents intelligents

robot
Création du résumé en cours
ME News Actualités, le 23 avril (UTC+8), NVIDIA AI a récemment annoncé que sa bibliothèque open source NVIDIA NeMo RL a ajouté une nouvelle capacité, prenant en charge l'apprentissage par renforcement (RL) en utilisant le format FP8 à faible précision pour la post-formation, afin d'accélérer les charges de travail de calcul associées. Selon les informations publiées, sur le modèle Qwen3-8B-Base, l'utilisation du format FP8 peut augmenter la vitesse des charges de travail RL de 1,48 fois. Cette accélération vise à permettre des cycles d'itération plus rapides pour l'utilisation d'outils par l'agent et la réalisation de tâches multi-étapes. (Source : InFoQ)
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire