طاقة نموذج من 70 طبقة تساوي قوة النماذج الصغيرة التقليدية، تصميم الهيكلية GA/SWA بنسبة 1:7 لديه شيء مميز

شاهد النسخة الأصلية
BlockBeatNews
روفليري تكشف عن بطاقة خفض التكاليف في MiMo: حسابات الانتباه المسبق تقتصر على 10 طبقات وتصل إلى مستوى GQA العالمي
بعد انخفاض الأسعار الدائم لـ API لنموذج مي مي-في 2.5 من شاومي، تم الإعلان عن تقليل التكاليف من خلال دمج الانتباه المختلط وذاكرة التخزين المؤقت الهرمية: زيادة ملحوظة في نسبة نجاح التخزين المؤقت وسعة التخزين، وانخفاض كبير في تكلفة التخزين المؤقت، مع دمج التداخل في التخزين المؤقت لخفض التكاليف بشكل أكبر. انخفضت تكاليف الإدخال والإخراج بنسبة 60-80%، نظرًا لأن نسبة طبقة GA/SWA هي 1:7، فإن مرحلة التهيئة المسبقة تحسب فقط النافذة المحلية، مما يجعل قوة الحوسبة لنموذج مكون من 70 طبقة تعادل نموذجًا تقليديًا بعدد طبقات أقل. الانخفاض في الأسعار هو تقليل هيكلي في التكاليف، ويؤكد على التعاون بين خوارزميات الأساس ونظام الاستدلال للسيطرة على التكاليف، وتجنب حرب الأسعار.
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت