شركة China Unicom تقدم إطار عمل جديد باسم MeanCache، وتحديث معيار تسريع استنتاج نماذج التوليد متعددة الوسائط

robot
إنشاء الملخص قيد التقدم

تداول الأسهم ينظر إلى تقارير محللي شركة جين كيلينغ، وهي موثوقة، احترافية، في الوقت المناسب، وشاملة؛ تساعدك على اكتشاف فرص المواضيع ذات الإمكانات!

(المصدر: Pro من شركة Machines آي)

نبذة عن المؤلف والفريق: المؤلف الأول في هذا المقال هو هوانغ هوانلينغ، والمؤلف المراسل هما تشاو فانغ وليان شي غوي، وجميع المؤلفين من فريق تطوير نموذج يونيون يوانجينغ (Unium Jing) لدى شركة China Unicom Data Intelligence (معهد أبحاث علوم البيانات والذكاء الاصطناعي التابع لشركة الصين يونيكوم) ومن جامعة نانجينغ، ويركزون على تطوير نموذج يونيون يوانجينغ التابع لشركة China Unicom.

تعد سرعة الاستدلال لِنماذج التوليد متعددة الوسائط مثل FLUX وQwen-Image من نقاط الألم المستمرة عند تطبيق نماذج متعددة الوسائط على مستوى صناعي. غالبًا ما تتسبب حلول التخزين المؤقت للسمات التقليدية (Feature Caching)، عند السعي إلى تسريع بمضاعفات عالية، في انحراف المسارات بسبب التقلبات الشديدة في السرعة اللحظية.

وبالنظر إلى نقطة الألم هذه، واصل فريق أبحاث شركة China Unicom Data Science and Artificial Intelligence Research Institute وفريق بحث من جامعة نانجينغ، بناءً على العمل السابق LeMiCa (NeurIPS 2025 Spotlight)، التعمّق وإطلاق إطار تسريع متطور MeanCache.

لا يواصل هذا العمل فقط إرث الفريق في مجال تسريع نماذج الانتشار، بل يحقق أيضًا قفزة تقنية: مستلهمًا من MeanFlow، يُدخل MeanCache لأول مرة منظور “السرعة المتوسطة” في التخزين المؤقت للاستدلال، ويقوم بتصحيح دقيق لمسارات التوليد باستخدام JVP، محققًا تسريعًا في الاستدلال يزيد عن 4x. وقد تم إدراج هذا الإنجاز ضمن قمة مؤتمر الذكاء الاصطناعي ICLR 2026، وفي الوقت الحالي، تم نشر الورقة والشفرة المصدرية وكلاهما مفتوح المصدر.

الابتكار التقني: نموذج جديد للتخزين المؤقت تقوده السرعة المتوسطة

تتمثل الإسهامات الأساسية لـ MeanCache في تحويل التسريع باستخدام التخزين المؤقت من “السرعة اللحظية” إلى “السرعة المتوسطة”، وهو ما يتضمن بشكل أساسي نقطتين تقنيتين:

السرعة المتوسطة المدفوعة بـ JVP

في طريقة النمذجة هذه، يمتد منظور التخزين المؤقت من “نقطة” مفردة إلى “فترة”، عبر توفير إشارة إرشاد أكثر استقرارًا، يتم من خلالها تصحيح انحراف المسارات بفعالية في ظروف التسريع بمضاعفات عالية.

استراتيجية جدولة استقرار المسار

“متى يجب أن نُخزّن؟” كانت الطرق السابقة تعتمد غالبًا على خطوة ثابتة أو حدود يدوية. تقوم MeanCache بنمذجة عملية الاستدلال باعتبارها مسألة تحسين على رسم متعدد (Multigraph).

تتعامل مع كل خطوة زمنية باعتبارها عقدة، وتعرّف الانحرافات الناتجة عن عدم الاستقرار بين سرعة المتوسط المتوقعة والقيمة الحقيقية كأوزان للحواف:

تشكل العقد والحواف رسمًا متعددًا، ثم من خلال خوارزمية كبت القمم لمسار أقصر (Peak-Suppressed Shortest Path) لحساب استراتيجية التخزين المؤقت المثلى، ضمن ميزانية حسابية محددة، وتحت قواعد حساب معينة:

نتائج التجارب: تحديث أداء SOTA للتسريع

توليد صور من نص

في نماذج توليد الصور من نص على مستوى تجاري Qwen-Image وFLUX.1 [dev] تم تحقيق أعلى تسريع بمقدار 4x على التوالي، والوصول إلى أداء SOTA على Image Reward ومقاييس الإدراك.

ومن منظور التأثير البصري، ومع زيادة نسبة التسريع، تُظهر الصور المولدة بواسطة MeanCache أداءً أفضل من حيث اتساق المحتوى.

توليد فيديو من نص

تم أيضًا تحقيق تسريع بمقدار 3.6x وتحسين مؤشرات SOTA في نموذج توليد الفيديو HunyuanVideo.

وفي التحليل النوعي للفيديو، تُظهر MeanCache تأثير تسريع أفضل أيضًا، سواء من حيث جودة الصورة أو اتساق المحتوى.

الاتساق الدلالي: خطوة إضافية؛ ضمن اختبارات Promptات عالية الصعوبة للكلمات النادرة (مثل “Peristeronic” كما في الشكل أدناه)، تُظهر MeanCache قدرةً أقوى على الصمود الدلالي.

توصية من أفضل الفرق في الصناعة

في الوقت نفسه، أصبحت MeanCache تدعم أحدث نماذج توليد الصور من نص في Ali Tongyi Z-Image وQwen-Image-2512، وقد حصلت على توصية الصفحة الرسمية لفريق Z-Image، كما تم دعمها في المجتمع باستخدام ComfyUI

الخلاصة والتطلع إلى المستقبل

تُعد MeanCache إطارًا خفيف الوزن للتسريع في Flow Matching بدون تدريب، وقد اقترحت بشكل ابتكاري حلول “تخزين السرعة المتوسطة” و“جدولة استقرار المسار”. يضمن هذا الحل، مع الحفاظ على دقة عالية للصور واتساق المحتوى، تحسينًا ملحوظًا في كفاءة استدلال النماذج الكبيرة. سيستند فريق نماذج يونيون يوانجينغ إلى ذلك كأساس، وسيواصل التعمّق في مجالات تسريع استدلال النماذج وتوليد سيناريوهات معقدة. نلتزم بتقديم المزيد من وجهات النظر التقنية المتنوعة للصناعة، والمساعدة في خفض عتبة استخدام نماذج التوليد على مستوى صناعي وتقليل تكاليف الحوسبة.

كمّ هائل من المعلومات وتفسير دقيق، كل ذلك على تطبيق Sina Finance

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.23Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.26Kعدد الحائزين:2
    0.07%
  • القيمة السوقية:$2.22Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.23Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.23Kعدد الحائزين:0
    0.00%
  • تثبيت