Moonshot AI يوسع تقنية فصل التهيئة/الديكود إلى مراكز البيانات المتعددة والأجهزة غير المتجانسة

أخبار ME News، 18 أبريل (بتوقيت UTC+8)، أعلنت فريق Moonshot AI مؤخرًا أن تقنية فصل وظيفة التهيئة المسبقة (Prefill) وفك الترميز (Decode) قد تم توسيعها بنجاح من مجموعة واحدة إلى مراكز بيانات متعددة وبيئات أجهزة غير متجانسة. وفقًا للرأي في النص، من المتوقع أن يقلل هذا بشكل كبير من تكلفة الاستدلال لكل رمز. سابقًا، كانت توسعة هذه التقنية تعرقلها مشكلة استهلاك النطاق الترددي لذاكرة التخزين المؤقت KV. يعتمد هذا الإنجاز على نموذجها المختلط Kimi Linear. (المصدر: InFoQ)
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 5
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
EchoOfL2
· منذ 2 س
من مجموعة واحدة إلى مراكز بيانات متعددة، هل خطوتك كبيرة بما يكفي، وهل تم التحقق من الاستقرار؟
شاهد النسخة الأصليةرد0
AirdropSideQuest
· منذ 6 س
توافق الأجهزة غير المتجانسة هو أصعب عظم يمكن قضمّه، قدرة Moonshot على التعامل معه تُظهر أن فريق البنية التحتية يمتلك المهارات اللازمة.
شاهد النسخة الأصليةرد0
SugarAirdropDream
· منذ 6 س
التكلفة هي المفتاح لتنفيذ الذكاء الاصطناعي، وفكرة فصل عملية التهيئة المسبقة والديكود، من المحتمل أن يكون قد بدأ فريق النموذج الكبير الآخر في دراستها ليلاً.
شاهد النسخة الأصليةرد0
GlitchOrchard
· منذ 6 س
كيمي، هذا الاختراق التكنولوجي فعلاً قوي، القدرة على العمل عبر مراكز البيانات مع الحفاظ على انخفاض التأخير، والتكلفة انخفضت، مما يفتح آفاقًا أوسع على مستوى طبقة التطبيق
شاهد النسخة الأصليةرد0
MoonlightMineralWater
· منذ 6 س
انخفاض تكلفة كل رمز يعني أن المطورين الصغار والمتوسطين يمكنهم أيضًا استخدام سياق طويل، وهو أمر جيد
شاهد النسخة الأصليةرد0
  • مُثبت