أخبار شبكة العملات، تعاونت Sakana AI مع NVIDIA لفتح مصدر تنسيق البيانات النادرة المسمى twell ونواة التسريع المصاحبة، مما نجح في جعل وحدة معالجة الرسومات تتجاوز تلك الحسابات غير الفعالة «النتائج قريبة من الصفر» عند تشغيل النماذج الكبيرة. هذه الخطة، دون فقدان دقة النموذج، أدت إلى زيادة سرعة الاستدلال على H100 بنسبة تصل إلى 30%، وتسريع التدريب بنسبة تصل إلى 24%، وتوفير كبير في ذروة الذاكرة الفعلية. كما كشفت البيانات عن قاعدة: كلما زاد عدد معلمات النموذج، زاد عدد الخلايا العصبية في حالة السكون (نسبة غير صفرية لنموذج بـ 2 مليار معلمة أقل بنسبة 38% من نموذج بـ 500 مليون معلمة). هذا يعني أنه في المستقبل، عند السعي لنماذج أكبر حجمًا، ستوفر هذه التحسينات الموجهة للأجهزة الأساسية فوائد أداء أكبر.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت