NVIDIA NeMo RL は FP8 低精度強化学習後の訓練をサポートし、エージェントの反復を加速します

robot
概要作成中
ME News 消息,4 月 23 日(UTC+8),NVIDIA AI 近日宣布,其开源库 NVIDIA NeMo RL 新增了一项能力,支持使用低精度 FP8 格式进行强化学习(RL)后训练,以加速相关计算工作负载。根据其发布的信息,在 Qwen3-8B-Base 模型上,使用 FP8 格式可将 RL 工作负载的速度提升 1.48 倍。这一加速旨在为智能体的工具使用和多步骤任务实现更快的迭代周期。(来源:InFoQ)
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし