SonicMoE يعمل بأقصى إنتاجية على معالج NVIDIA Blackwell GPU.

robot
إنشاء الملخص قيد التقدم
ME News رسالة، في 23 أبريل (UTC+8)، أعلنت SonicMoE أنها يمكنها الآن تحقيق أداء ذروة الإنتاجية على وحدات معالجة الرسوميات NVIDIA Blackwell. وفقًا للبيانات التي قدمتها، فإن أداء TFLOPS للانتشار الأمامي والخلفي للنموذج يتجاوز معيار DeepGEMM بنسبة 54% و35% على التوالي، بينما يتجاوز أداء TFLOPS للانتشار الأمامي المثال الرسمي لـ triton بنسبة 21%. في الوقت نفسه، لا تزال SonicMoE تحافظ على أصغر حجم للذاكرة النشطة، مماثل للنموذج الكثيف. (المصدر: InFoQ)
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت