PrfaaS هذه الفكرة المعمارية جريئة جدًا — فصل PD إلى أقصى حد، تعبئة مسبقة مستقلة كخدمة، وتوجيه حسب حد الطول، أظهرت اختبارات أنها يمكن أن تستخرج 32% من خلال الأداء أكثر من التوزيع البسيط، والابتكار في طبقة البنية التحتية بدأ يتصاعد.

شاهد النسخة الأصلية
MeNews
الجانب المظلم للقمر والأبحاث الجديدة من جامعة تسينغهوا: يمكن لملء النموذج المسبق لـ LLM أن يتجاوز مراكز البيانات، وزيادة قدرة المعالجة لنموذج 1 تيرابايت بنسبة 54%
أفادت تقارير أخبار ME أن الجانب المظلم للقمر وتيشوان قدمت على arXiv خدمة Prefill-as-a-Service، التي تشغل مرحلة التعبئة المسبقة لاستنتاج النموذج الكبير عبر مراكز البيانات. من خلال نموذج انتباه مختلط، تم تقليل استهلاك عرض النطاق الترددي لذاكرة التخزين المؤقت بشكل ملحوظ، مما يسمح بنقل التخزين المؤقت عبر الإيثرنت وإعادته إلى فك تشفير العنقود المحلي. قام فريق بنية PrfaaS ببناء مجموعة تعبئة مسبقة مستقلة، حيث يتم توجيه الطلبات التي لم يتم تلبية سياقها الطويل فقط، بينما تظل الطلبات القصيرة في وحدة التخزين المحلية؛ كما تم إدخال توجيه عتبة الطول، وجدولة حساسة للنطاق الترددي. أظهرت الاختبارات على نموذج مختلط بقدرة 1 تيرابايت، زيادة في الأداء بنسبة 54% مقارنة بوحدة التخزين المحلية المتطابقة، و32% مقارنة بالتصميم غير المتجانس البسيط.
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت