تم إصدار سلسلة نماذج GLM-5.1 REAP، وتوفر العديد من النسخ المعدلة من حيث التكميم والتقليم

robot
إنشاء الملخص قيد التقدم
أخبار ME News، 22 أبريل (بتوقيت UTC+8)، مؤخرًا، تم إصدار سلسلة نماذج GLM-5.1 REAP المبنية على نموذج BF16 بحدود 7440 مليار معلمة. تم إنشاء هذه السلسلة من خلال تقنيات تقليم REAP وتقنيات التكميم المتنوعة، بهدف التوافق مع أجهزة مختلفة. يقوم تقليم REAP بتقييم مساهمة كل خبير في نموذج الخبراء المختلط، وإزالة الخبراء الأقل مساهمة وإعادة ترقيم بوابات التوجيه، بهدف تقليل خسارة الجودة. توفر السلسلة العديد من النسخ الأساسية بما في ذلك BF16، NVFP4، GPTQ W4A16 وGGUF، بحجم معلمات يتراوح من حوالي 285 جيجابايت إلى 1125 جيجابايت، مصممة خصيصًا لتحسين أداء وحدات معالجة الرسومات أو المعالجات المركزية المختلفة مثل Hopper وAmpere وBlackwell. جميع النماذج مرخصة بموجب رخصة MIT، ويمكن نشرها باستخدام محركات مثل sglang وvLLM أو llama.cpp. (المصدر: InFoQ)
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت