هل تؤخر شركة هواوي إصدار DeepSeek V4 بسبب شرائحها؟ نفس النواة تحقق سرعة تقارب الضعف على NVIDIA Ascend

وفقًا للمراقبة التي أجرتها Dongcha Beating، قبل إصدار DeepSeek V4، كانت هناك تكهنات واسعة في المجتمع بأن الإطلاق قد تأخر بسبب صعوبات في تكييف النموذج من NVIDIA إلى منصة Huawei Ascend. على الرغم من أن التقرير الفني لـ V4 لم يتناول مباشرة هذا الشائعة، إلا أن بيانات الأداء المعلنة تتناقض معها بشكل كبير. يُظهر التقرير أن خطة تقسيم الخبراء الدقيقة (Fine-Grained EP Scheme) تم نشرها والتحقق منها بنجاح على كل من وحدات معالجة الرسومات NVIDIA و Huawei Ascend NPUs، محققة تسريعًا يتراوح بين 1.50 إلى 1.73 مرة للأحمال العادية، وحتى 1.96 مرة في سيناريوهات الحساسة للكمون مثل تنفيذ RL وخدمات الوكيل عالية السرعة. كما قام الفريق أيضًا بفتح مصدر نواة CUDA لنسخة MegaMoE كجزء من DeepGEMM. بعبارة أخرى، أظهر V4 كفاءة قريبة من الحدود النظرية على كلا المنصتين، ولم تؤدِ التكيفات عبر المنصات إلى فقدان في الأداء.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت