كوكا DLM يضع النص في مساحة مخفية مستمرة ثم ينتشر، اختيار بنية Flow Matching+DiT يشبه Byte — طابع هندسي قوي، لكن بدون SFT أو RLHF من نقطة تفتيش خام، الآن هو مجرد لعبة بحثية، ننتظر ظهور خط أنابيب متعدد الوسائط لنرى إذا كان يمكن أن ينافس.

شاهد النسخة الأصلية
MeNews
شركة ByteDance تفتح مصدر Cola DLM: إعادة تعريف توليد النصوص باستخدام نموذج الانتشار
يعد Seed مفتوح المصدر من ByteDance وCola DLM، وهو نموذج يقوم بتوسيع النصوص على مستوى المعنى الكامن. يقوم Text VAE بتحويل النص إلى مساحة كامن مستمرة، ويتعلم DiT ذو السببية المعيقة عبر مطابقة التدفق من خلال تعلم prior الكامن، وأخيرًا يقوم المفسر الشرطي بإعادة تحويل المتغيرات الكامنة إلى نص. إجمالي المعلمات حوالي 2.3 مليار (DiT 1.8 مليار، VAE 500 مليون). في 8 تقييمات، ينافس ويحتل مراكز متقدمة مع خط الأساس AR/LLaDA من نفس الحجم، لكنه لا يزال نموذجًا بحثيًا، لم يتم تدريبه على أوامر دقيقة أو RLHF، ويحتوي المستودع الحالي فقط على خط أنابيب النصوص، ومن المتوقع أن يتوسع في المستقبل ليشمل النصوص والصور.
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت