كامبري أكملت تكييف DeepSeek-V4، والكود أصبح مفتوح المصدر، مما أدى إلى ارتفاع أسهم الرقائق المحلية.

robot
إنشاء الملخص قيد التقدم

وفقًا لمراقبة Beating، أعلنت شركة كاميكازي أنها أكملت التوافق مع نموذجين، 285B DeepSeek-V4-Flash و 1.6T DeepSeek-V4-Pro، في يوم إصدار V4، استنادًا إلى إطار استنتاج vLLM، وتم فتح رمز التوافق على GitHub.

يعتمد سرعة التوافق على شرطين: الأول هو أن دعم مجموعة برامج NeuWARE المطورة ذاتيًا من كاميكازي بشكل أصلي لـ PyTorch و vLLM وغيرها من الأطر الرئيسية، مما يتيح نقل النموذج بسرعة؛ والثاني هو أن شرائح كاميكازي تدعم بشكل أصلي تنسيقات البيانات ذات الدقة المنخفضة، دون الحاجة إلى تحويل تنسيق إضافي للتحقق من الدقة. بالنسبة للهيكل الجديد لـ V4، قامت كاميكازي بتطوير مكتبة عمليات دمج Torch-MLU-Ops، التي توفر تسريعًا خاصًا لوحدات مثل Compressor و mHC، واستخدمت BangC لكتابة نوى العمليات الشائعة مثل Attention المجزأة/الضغط، و GroupGemm.

على مستوى إطار الاستنتاج، تدعم كاميكازي في vLLM التوازي المختلط للأبعاد الخمسة TP/PP/SP/DP/EP، والتوازي في الاتصالات والحسابات، وتكميم الدقة المنخفضة، ونشر PD المنفصل. ذكرت تقارير تقنية V4 فقط التحقق على وحدات GPU من NVIDIA و NPU من Huawei Ascend، ولم تتطرق إلى منصة كاميكازي، حيث تم إتمام التوافق بشكل مستقل من قبل الشركة. وبفضل أخبار إصدار V4، شهد قطاع الرقائق المحلية في سوق الأسهم الصينية ارتفاعًا قويًا، وارتفعت أسهم كاميكازي بشكل مباشر خلال التداول.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت