أخيرًا أطلقت شركة ByteDance نموذج اللغة المنتشرة، حيث تستخدم 23 مليار معلمة لإنتاج النصوص في الفضاء الكامن، وهو نهج جريء جدًا.

شاهد النسخة الأصلية
MeNews
شركة ByteDance تفتح مصدر Cola DLM: إعادة تعريف توليد النصوص باستخدام نموذج الانتشار
يعد Seed مفتوح المصدر من ByteDance وCola DLM، وهو نموذج يقوم بتوسيع النصوص على مستوى المعنى الكامن. يقوم Text VAE بتحويل النص إلى مساحة كامن مستمرة، ويتعلم DiT ذو السببية المعيقة عبر مطابقة التدفق من خلال تعلم prior الكامن، وأخيرًا يقوم المفسر الشرطي بإعادة بناء المتغيرات الكامنة إلى نص. إجمالي المعلمات حوالي 2.3 مليار (DiT 1.8 مليار، VAE 500 مليون). في 8 تقييمات، يتنافس ويحتل مراكز متقدمة مع خط الأساس AR/LLaDA من نفس الحجم، لكنه لا يزال نقطة تحقق بحثية، لم يتم تدريبه على أوامر دقيقة أو RLHF، ويحتوي المستودع الحالي فقط على خط أنابيب النص، ومن المتوقع أن يتوسع في المستقبل ليشمل النص-صورة.
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت