نظام NVIDIA NeMo RL يدعم التعلم المعزز بدقة منخفضة FP8 بعد التدريب، مما يسرع تكرار الوكيل الذكي

robot
إنشاء الملخص قيد التقدم
أخبار ME، 23 أبريل (بتوقيت UTC+8)، أعلنت شركة NVIDIA AI مؤخرًا عن إضافة قدرة جديدة لمكتبتها المفتوحة المصدر NVIDIA NeMo RL، وهي دعم التعلم المعزز (RL) باستخدام تنسيق FP8 منخفض الدقة لإعادة التدريب، بهدف تسريع أعباء العمل الحسابية ذات الصلة. وفقًا للمعلومات التي أُصدرت، على نموذج Qwen3-8B-Base، يمكن أن يؤدي استخدام تنسيق FP8 إلى زيادة سرعة أعباء عمل RL بمقدار 1.48 مرة. يهدف هذا التسريع إلى تمكين دورات تكرارية أسرع في استخدام الأدوات للكيانات الذكية وتنفيذ مهام متعددة الخطوات. (المصدر: InFoQ)
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت