تجمع Tsinghua + جانب الظلام من الشهر له بعض الاهتمام، أرسل prefill إلى مركز البيانات البعيد، وأخيرًا تم فك قيود RDMA.

شاهد النسخة الأصلية
MeNews
الجانب المظلم للقمر والأبحاث الجديدة من جامعة تسينغهوا: يمكن لملء النموذج المسبق لـ LLM أن يتجاوز مراكز البيانات، وزيادة قدرة المعالجة لنموذج 1 تيرابايت بنسبة 54%
أخبار ME News، 18 أبريل (بتوقيت UTC+8)، وفقًا لمراقبة 动察 Beating، نشرت Moonshot AI مع جامعة Tsinghua في 16 أبريل ورقة بحثية جديدة على arXiv بعنوان «Prefill-as-a-Service»، تقترح تشغيل مرحلة التهيئة المسبقة (prefill) لاستنتاج النموذج الكبير عبر مراكز البيانات. تتكون استنتاجات النموذج الكبير من خطوتين: تقوم مرحلة التهيئة المسبقة بقراءة الإدخال مرة واحدة، وتوليد ذاكرة تخزين مؤقتة من نوع KV؛ ثم تقوم عملية الت decoding بإخراج النتائج كلمة بكلمة استنادًا إلى هذه الذاكرة المؤقتة. تتطلب الخطوتان خصائص أجهزة مختلفة تمامًا، حيث تستهلك مرحلة التهيئة المسبقة قوة حسابية، بينما تستهلك عملية الت decoding ذاكرة الفيديو وعرض النطاق الترددي. النهج السائد في الصناعة هو فصل الخطوتين على آلات مختلفة (فصل PD)، لكن هذا يتطلب أن تكون الجهتان متصلتين عبر RDMA داخل نفس مركز البيانات، لأن الاتصال المكثف
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت