كيمني هذه المرة فهمت بشكل جيد فصل إعداد مسبق/فك التشفير، يمكنها تقليل تكلفة الاستنتاج عبر مراكز البيانات، شيء جيد

شاهد النسخة الأصلية
MeNews
Moonshot AI يوسع تقنية فصل التحميل المسبق/التحويل إلى مراكز بيانات متعددة وعتاد غير متطابق
أخبار ME News، 18 أبريل (بتوقيت UTC+8)، أعلنت فريق Moonshot AI مؤخرًا أن تقنية فصل وظيفة التهيئة المسبقة (Prefill) و فك التشفير (Decode) قد تم توسيعها بنجاح من مجموعة واحدة إلى مراكز بيانات متعددة وبيئات أجهزة غير متجانسة. ووفقًا للمقال، من المتوقع أن يساهم هذا الإجراء بشكل كبير في تقليل تكلفة استنتاج كل رمز. سابقًا، كانت توسعة هذه التقنية تعرقلها مشكلة استهلاك النفقات لنقل ذاكرة التخزين المؤقت KV. ويعتمد تحقيق هذا الاختراق بشكل رئيسي على نموذجها المختلط Kimi.
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت