جوجل تفتح مصدر نموذج فك التشفير للمخاطر الكاملة من سلسلة Gemma 4، بأقصى سرعة تصل إلى 3 أضعاف

robot
إنشاء الملخص قيد التقدم

موقع Coinjie News: أطلقت جوجل نموذج مسودة التنبؤ متعدد الرموز (MTP) من سلسلة Gemma 4 وفتح مصدره. يعتمد النموذج على بنية فك التشفير التخمينية، حيث يمكنه تحقيق تسريع في الاستنتاج يصل إلى 3 أضعاف مع الحفاظ على الوزن النهائي للتحقق من النموذج الرئيسي، دون التأثير على جودة الإخراج. يستفيد حل MTP من القدرة الحاسوبية غير المستخدمة، حيث يتنبأ مسبقًا بعدة رموز مستقبلية، ثم يتم التحقق منها بشكل متوازي بواسطة نموذج الهدف الثقيل. إذا وافق نموذج الهدف على المسودة، يتم استلام التسلسل بالكامل مرة واحدة. يشارك نموذج المسودة حالة التنشيط وذاكرة التخزين المؤقت لـ KV مع نموذج الهدف، ولنماذج E2B و E4B، أدخل الفريق تقنية التجميع في طبقة الإدراج. حاليًا، أصبح نموذج MTP مفتوح المصدر بالكامل، ويدعم أطر الاستنتاج الرائدة مثل VLLM و SGLang و Ollama. أدت هذه التحسينات إلى تقليل عتبة التطبيق بشكل كبير، مما يتيح للمطورين تشغيل نماذج MOE بحجم 26 مليار و نماذج كثيفة بحجم 31 مليار بسلاسة على بطاقات رسومات استهلاكية عادية، كما يمكنها دعم التفاعل الذكي في الوقت الحقيقي على الأجهزة المحمولة باستهلاك طاقة أقل.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت