寒武纪完成DeepSeek-V4适配,代码已开源,带动国产芯片股走强

robot
إنشاء الملخص قيد التقدم
ME News أخبار، 24 أبريل (UTC+8)، وفقًا لرصد Beating، أعلنت شركة Cambricon عن إكمال تكييف نموذجين، 285B DeepSeek-V4-Flash و 1.6T DeepSeek-V4-Pro، في يوم إصدار V4، بناءً على إطار vLLM، وتم فتح الكود المكيف على GitHub. تعتمد سرعة التكييف على فرضيتين: الأولى هي أن مجموعة برامج NeuWare المطورة ذاتيًا من Cambricon تدعم بشكل أصلي الأطر الرئيسية مثل PyTorch و vLLM، مما يسمح بنقل النماذج بسرعة؛ والثانية هي أن رقاقات Cambricon تدعم بشكل أصلي تنسيقات البيانات منخفضة الدقة الشائعة، مما يسمح بإجراء التحقق من الدقة دون الحاجة إلى تحويل إضافي للتنسيق. بالنسبة للهيكل الجديد لـ V4، قامت Cambricon بتسريع وحدات مثل Compressor و mHC من خلال مكتبة المشغلين المدمجة ذاتيًا Torch-MLU-Ops، وكتبت نوى المشغلين الساخنة مثل الانتباه المتفرق/المضغوط و GroupGemm باستخدام BangC. على مستوى إطار الاستدلال، تدعم Cambricon في vLLM التوازي الهجين خماسي الأبعاد TP/PP/SP/DP/EP، والتوازي بين الحساب والاتصال، والقياس منخفض الدقة، والنشر المنفصل لـ PD. ذكر تقرير V4 التقني فقط التحقق على وحدات معالجة الرسومات NVIDIA ومعالجات NPU من Huawei، دون ذكر منصة Cambricon، وقد تم هذا التكييف بشكل مستقل من قبل Cambricon. بتأثير أخبار إصدار V4، ارتفع قطاع رقاقات أشباه الموصلات المحلية في سوق الأسهم الصينية من النوع A، وقامت Cambricon بارتفاع خطي خلال التداول. (المصدر: BlockBeats)
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت