أظلم القمر، هذه المرة ألقى التعبئة المسبقة في مركز البيانات البعيد، وذاكرة التخزين المؤقتة KV تتنقل عبر شبكة الإيثرنت ذهابًا وإيابًا، وزيادة معدل النقل بنسبة 54% حقًا قوية، وأخيرًا لم يعد من الضروري استهلاك عرض النطاق الترددي المحلي بالكامل للبيانات الطويلة.

شاهد النسخة الأصلية
MeNews
الجانب المظلم للقمر والأبحاث الجديدة من جامعة تسينغهوا: يمكن لملء النموذج المسبق في نماذج اللغة الكبيرة أن يتجاوز مراكز البيانات، وزيادة قدرة المعالجة لنموذج 1 تيرابايت بنسبة 54%
أفادت تقارير أخبار ME أن الجانب المظلم للقمر وتيشوان قدمت في arXiv خدمة Prefill-as-a-Service، التي تنفذ مرحلة الملء المسبق لاستنتاجات النماذج الكبيرة عبر مراكز البيانات. من خلال نموذج انتباه مختلط، تم تقليل استهلاك عرض النطاق الترددي لذاكرة التخزين المؤقت بشكل ملحوظ، مما يسمح بنقل التخزين المؤقت عبر Ethernet وإعادته إلى فك تشفير العنقود المحلي. يقوم هيكل PrfaaS ببناء مجموعة ملء مسبق مستقلة، حيث يتم توجيه الطلبات التي لم يتم تلبية سياقها الطويل فقط، بينما تظل الطلبات القصيرة في وحدة التخزين المحلية؛ كما يتم إدخال توجيه عتبة الطول، وجدولة حساسة للنطاق الترددي. أظهرت الاختبارات أن النموذج المختلط ذو 1 تيرابايت من المعلمات، يحقق زيادة في الإنتاجية بنسبة 54% مقارنة بوحدة التخزين المحلية المتطابقة، و32% مقارنة بالنموذج غير المتجانس البسيط.
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت