تم إصدار سلسلة نماذج GLM-5.1 REAP، مع توفير العديد من النسخ المعدلة للتكميم والتقليم

أخبار ME News، 22 أبريل (بتوقيت UTC+8)، مؤخرًا، تم إصدار سلسلة نماذج GLM-5.1 REAP المبنية على نموذج BF16 بقدرة 7440 مليار معلمة. تم إنشاء هذه السلسلة من خلال تقنيات تقليم REAP وتقنيات التكميم المتنوعة، بهدف التوافق مع أجهزة مختلفة. يقوم تقليم REAP بتقييم مساهمة كل خبير في نموذج الخبراء المختلط، وإزالة الخبراء ذوي المساهمة الأدنى وإعادة ترقيم بوابات التوجيه، بهدف تقليل خسارة الجودة. توفر السلسلة العديد من النسخ الأساسية بما في ذلك BF16، NVFP4، GPTQ W4A16 وGGUF، بحجم معلمات يتراوح من حوالي 285 جيجابايت إلى 1125 جيجابايت، مصممة خصيصًا لتحسين أداء وحدات معالجة الرسومات أو المعالجات المركزية المختلفة مثل Hopper وAmpere وBlackwell. جميع النماذج مرخصة بموجب رخصة MIT، ويمكن نشرها باستخدام محركات مثل sglang وvLLM وllama.cpp. (المصدر: InFoQ)
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت