كيمني هذه المرة فهمت بشكل جيد كيف تفصل بين التهيئة/الديكود، مما يتيح تقليل تكلفة التوكن عبر مراكز البيانات، شيء مثير للاهتمام

شاهد النسخة الأصلية
MeNews
Moonshot AI يوسع تقنية فصل التهيئة/الديكود إلى مراكز البيانات المتعددة والأجهزة غير المتجانسة
أخبار ME، 18 أبريل (بتوقيت UTC+8)، أعلنت فريق Moonshot AI مؤخرًا أن تقنية فصل وظيفة التمهيد المسبق (Prefill) وفك الترميز (Decode) قد تم توسيعها بنجاح من مجموعة واحدة إلى بيئات مراكز بيانات متعددة وبيئات أجهزة غير متجانسة. وفقًا للمقال، من المتوقع أن يقلل هذا الإجراء بشكل كبير من تكلفة استنتاج كل رمز. سابقًا، كانت توسعة هذه التقنية معوقة بسبب مشكلة استهلاك النفقات لنقل ذاكرة التخزين المؤقت KV. يعتمد تحقيق هذا الاختراق بشكل رئيسي على نموذجها المختلط Kimi.
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت