NVIDIA NeMo RL يدعم التدريب اللاحق لتعزيز التعلم بدقة منخفضة FP8، مما يسرع تكرار الوكلاء الأذكياء.

robot
إنشاء الملخص قيد التقدم
أخبار ME، في 23 أبريل (UTC+8)، أعلنت NVIDIA AI مؤخرًا عن إضافة قدرة جديدة لمكتبتها مفتوحة المصدر NVIDIA NeMo RL، وهي دعم استخدام تنسيق FP8 منخفض الدقة للتدريب اللاحق للتعلم المعزز (RL) لتسريع أعباء العمل الحسابية ذات الصلة. وفقًا للمعلومات التي نشرتها، باستخدام تنسيق FP8 على نموذج Qwen3-8B-Base، يمكن زيادة سرعة عبء عمل RL بمقدار 1.48 مرة. يهدف هذا التسريع إلى تحقيق دورات تكرار أسرع لاستخدام الأدوات من قبل العوامل الذكية والمهام متعددة الخطوات. (المصدر: InFoQ)
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت