DeepSeek-V4-Flash على Huawei Cloud

في 24 أبريل، تم إصدار نموذج DeepSeek-V4 رسميًا وفتح مصدره، مع دعم أولي من Huawei Cloud.
بالنسبة لنموذج DeepSeek-V4، قدمت Huawei Cloud دعمًا أوليًا لنموذج التكيف، مع آلية ضغط انتباه متعددة الطبقات، لتحقيق إدارة فعالة لذاكرة KVCache تحت آلية الانتباه V4، وتوفير أكثر من 10 عمليات دمج عالية الأداء من نوع Ascend مثل TopK و SWA و CFA، مع تحسينات إطار العمل مثل الجدولة غير المتزامنة و MTP متعدد الخطوات، لدعم استنتاج عالي الأداء بذاكرة سياق أصلية بطول 1 مليون.
حاليًا، منصة خدمات النموذج MaaS من Huawei Cloud توفر للمطورين خدمة Tokens التي تتيح استدعاء DeepSeek-V4-Flash API بدون نشر، بنقرة واحدة.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت