SkyRL جعل بدء تشغيل النموذج الكبير باردًا دائمًا في الذاكرة، وزيادة القدرة على المعالجة مباشرة ×3، هذه الفكرة قذرة جدًا

شاهد النسخة الأصلية
CoinNetwork
موقع Coinjie News، ذكرت أن OneMillion\_AI أصدر بيانًا يقول إن SkyRL المفتوح المصدر لتنفيذ تكديس التدريب المتزامن حقق تطورًا ذاتيًا كبيرًا لنموذج كبير خلال ساعات، حيث زاد إجمالي معدل المعالجة التجريبية بمقدار 2.81 مرة، وزاد معدل المعالجة داخل العقدة الواحدة في الوقت المطلق حوالي 3.25 مرة. يهدف هذا الهيكل إلى تقليل تكاليف التشغيل المبدئية لإعادة تحميل النماذج الضخمة من خلال الإقامة الدائمة لنموذج مشترك في ذاكرة GPU، لمساعدة المطورين على إتمام تدريب البيانات الحية للنموذج الكبير بتكلفة ذاكرة منخفضة جدًا.
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت