روفليري تكشف عن بطاقة خفض التكاليف لـ MiMo: حسابات الانتباه المسبق التعبئة انخفضت إلى مستوى GQA العالمي من 10 طبقات

robot
إنشاء الملخص قيد التقدم
موقع بي جيه وي نيوز، أعلنت رو فولي على منصة X عن آلية تقليل التكاليف الخوارزمية بعد تخفيض الأسعار الدائم لواجهة برمجة التطبيقات لسلسلة النموذج الكبير الذي تطوره MiMo-v2.5.
وكشفت أنه بعد توحيد سعر API مع DeepSeek، لا تزال محرك الاستنتاج عالي الحمل الخاص بشركة Xiaomi قادرًا على تحقيق التوازن بين الربح والخسارة، وأن انخفاض التكاليف يرجع بشكل رئيسي إلى بنية الانتباه المختلطة وتحسين تخزين KV الهرمي.
بالنسبة لهدف تقليل تكلفة الوصول إلى التخزين بنسبة 99%، نفذت إطار استنتاج Xiaomi تحسينات هرمية لتخزين KV الخاص بانتقاء الانتباه النافذ، وأظهرت الاختبارات الإنتاجية أن هذا التحسين الهرمي رفع سعة الرموز المخزنة إلى 5 أضعاف، وخفضت تكلفة التخزين بنسبة 80%.
قالت رو فولي إن خدمات الاستنتاج ذات التكاليف المنخفضة تساهم في تحفيز الطلب على الذكاء الاصطناعي في الأجهزة الطرفية، ويجب على شركات النماذج الكبيرة تجنب حرب الأسعار العمياء، من خلال تصميم متكامل للخوارزميات ونظام الاستنتاج على مستوى الأساس، للسيطرة على التكاليف التشغيلية الفعلية بحيث تظل تحت خط التوازن بين الربح والخسارة.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 5
  • 2
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
ASolitaryRockBeforeTheVolcano
· منذ 4 س
انخفض سعر MiMo بهذه الطريقة بشكل حاد، انخفاض بنسبة 99٪ في التكاليف يبدو وكأنه من أفلام الخيال العلمي، لكن تحسينات SWA فعلاً لها بعض الفعالية
شاهد النسخة الأصليةرد0
LendingRateAnxiety
· منذ 4 س
الانتباه المختلط + التخزين المؤقت الهرمي، مع هذه المجموعة من التقنيات، زادت عبء تكاليف الاستنتاج على الشركات الصغيرة.
شاهد النسخة الأصليةرد0
Pragmatists
· منذ 4 س
كيف يتم تحقيق زيادة سعة التخزين المؤقتة بمقدار 5 مرات؟ هل هناك أوراق بحثية عن التخزين المؤقت الهرمي للـKV لأقرأها بالتفصيل؟
شاهد النسخة الأصليةرد0
InstantNoodlesWithContracts
· منذ 4 س
التعاون بين خوارزمية ومستوى النظام لتقليل التكاليف هو الحل الصحيح، فقط التركيز على سعر الألواح لا يجدي نفعًا، روفيري تدرك ذلك بوضوح.
شاهد النسخة الأصليةرد0
PocketValidator
· منذ 4 س
لا تزال DeepSeek متوازنة بعد التوافق، مما يدل على أن التسعير المسبق قد ترك مساحة فعلًا، والآن يُعتبر عودة إلى المعقولية
شاهد النسخة الأصليةرد0
  • مُثبت