نظام NVIDIA NeMo RL يدعم التعلم المعزز بدقة منخفضة FP8 بعد التدريب، مما يسرع تكرار الوكيل الذكي

robot
إنشاء الملخص قيد التقدم
ME News 消息,4 月 23 日(UTC+8),NVIDIA AI 近日宣布,其开源库 NVIDIA NeMo RL 新增了一项能力,支持使用低精度 FP8 格式进行强化学习(RL)后训练,以加速相关计算工作负载。根据其发布的信息,在 Qwen3-8B-Base 模型上,使用 FP8 格式可将 RL 工作负载的速度提升 1.48 倍。这一加速旨在为智能体的工具使用和多步骤任务实现更快的迭代周期。(来源:InFoQ)
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت