أخيرًا حققت نماذج اللغة الكبيرة على مستوى الأحرف تقدمًا جديًا، حيث يمكن لنموذج بحجم 1.7 مليار أن يقترب من أداء التقسيم إلى كلمات، وربما تصبح معركة جداول المفردات قديمة.

شاهد النسخة الأصلية
CoinNetwork
أكدت شركة Nous Research أن فوائد التقسيم يمكن محاكاتها بالكامل بواسطة BytePure، مما يفتح آفاقًا جديدة لنموذج كبير بدون تقسيم.
بحوث Nous Research تشير إلى أن الاعتماد طويل الأمد لنماذج اللغة الكبيرة على المحلل التقسيمي قد يُستبدل في المستقبل. أظهرت اختبارات مراقبة ببارامتر 1.7 مليار أن فوائد آلية التقسيم يمكن محاكاتها على مستوى البايتات الصافية من خلال وسائل هندسية. أظهرت التجارب أنه في النماذج الأصلية للبايتات، زيادة الإنتاجية وإدخال حدود الشكلية يمكن أن يقلل بشكل كبير من الفجوة مع نماذج التقسيم؛ وبنفس القدرة الحاسوبية، فإن محاكاة الضغط لزيادة كمية التدرجات في خطوة واحدة تُعد المصدر الرئيسي للمساهمة. في الوقت نفسه، تم إضافة حدود الكلمات الفرعية إلى مدخلات البايتات، مما أسس انحياز استنتاجي طويل الأمد لا يكشف عن معلومات مستقبلية. على الرغم من أن التأثير التعاوني لبارامترات أكبر لا يزال بحاجة إلى التحقق، إلا أنه في حالة 1.7 مليار، فإن فوائد معلمات القاموس وتوقع الكلمة الفرعية التالية محدودة. هذا يوفر فكرة جديدة لنماذج كبيرة بدون تقسيم، ويجب أن يركز الهيكل المستقبلي على زيادة الإنتاجية ودمج المعرفة الشكلية بشكل صريح دون كشف المعلومات.
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت