كان تدريب النموذج سابقًا يشبه الانتقال إلى منزل جديد، والآن يشبه تغيير ملاءات السرير — القاعدة ثابتة، والبيانات تُوضع فوقها فقط

شاهد النسخة الأصلية
CoinNetwork
موقع Coinjie News، ذكرت أن OneMillion\_AI أصدر بيانًا يقول إن SkyRL المفتوح المصدر لتنفيذ تكديس التدريب المتزامن حقق تطورًا ذاتيًا كبيرًا لنموذج كبير خلال ساعات، حيث زاد إجمالي معدل المعالجة التجريبية بمقدار 2.81 مرة، وزاد معدل المعالجة داخل العقدة الواحدة في الوقت المطلق حوالي 3.25 مرة. يهدف هذا الهيكل إلى تقليل تكاليف التشغيل المبدئية لإعادة تحميل النماذج الضخمة من خلال الإقامة الدائمة لنموذج مشترك في ذاكرة GPU، لمساعدة المطورين على إتمام تدريب البيانات الحية للنموذج الكبير بتكلفة ذاكرة منخفضة جدًا.
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت