انخفاض تكلفة استدعاء التخزين المؤقت بنسبة 99% قد يبدو مبالغًا فيه، لكن ذاكرة التخزين المؤقت الهرمية من مستوى SWA يمكنها بالفعل زيادة السعة، والحد الأدنى لنقطة التعادل هو ما يشكل فعلاً الحصن المنيع

شاهد النسخة الأصلية
CoinNetwork
روفليري تكشف عن بطاقة خفض التكاليف لـ MiMo: حسابات الانتباه المسبق التعبئة انخفضت إلى مستوى GQA العالمي من 10 طبقات
موقع بي جيونغ نيوز يذكر أن روفلي أعلنت على منصة X عن آلية خفض التكاليف الدائمة لواجهة برمجة التطبيقات MiMo-v2.5 بعد التوافق مع DeepSeek: بعد التوافق، لا تزال عمليات الاستدلال ذات الحمل العالي توازن بين الربح والخسارة، وتأتي التكاليف من الانتباه المختلط وذاكرة التخزين المؤقت الهرمية لـ KV. لتحقيق هدف تقليل تكلفة نجاح ذاكرة التخزين المؤقت بنسبة 99%، قام إطار استدلال Mi بتحسين ذاكرة التخزين المؤقت الهرمية لـ KV لـ SWA، وأظهرت الاختبارات أن سعة التخزين المؤقت زادت بمقدار 5 أضعاف، وتكلفتها انخفضت بنسبة 80%. وأشارت إلى أن الاستدلال منخفض التكلفة يمكن أن يحفز الطلب النهائي، ويجب على الشركات تجنب التخفيضات المدمرة، من خلال التعاون بين الخوارزميات ونظام الاستدلال في الطبقة الأساسية، للسيطرة على التكاليف التشغيلية الفعلية لتكون أقل من خط التوازن.
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت