智谱GLM-5.2 تتوج مؤشر الذكاء AA مفتوح المصدر الأول: GDPval يتساوى مع GPT-5.5 في الأداء

robot
إنشاء الملخص قيد التقدم
تقرير من 金色财经، أحدث نموذج MoE الرائد من 智谱 AI، GLM-5.2، حقق 51 نقطة في تقييم Artificial Analysis لنموذج الذكاء الاصطناعي الكبير الإصدار 4.1، متفوقًا على MiniMax-M3 (44 نقطة)، وDeepSeek V4 Pro (max، 44 نقطة)، وKimi K2.6 (43 نقطة)، متصدرًا قائمة النماذج المفتوحة المصدر على مستوى العالم.
في اختبار GDPval-AA v2 لمحاكاة العمل المعرفي في العالم الحقيقي، حصلت GLM-5.2 على 1524 نقطة (مقارنة بالمعيار البشري 1000 نقطة)، متقدمة على MiniMax-M3 (1418 نقطة) وDeepSeek V4 Pro (max، 1328 نقطة)، ومتساوية مع النموذج المتقدم المغلق المصدر GPT-5.5 (xhigh reasoning). مقارنة بالنسخة السابقة GLM-5.1، زادت قدرات الاستنتاج العلمي CritPt بنسبة 16 نقطة مئوية لتصل إلى 21%، وHLE بنسبة 12 نقطة مئوية لتصل إلى 40%، وTerminalBench v2.1 بنسبة 16 نقطة مئوية لتصل إلى 78%، وحقق GPQA Diamond نسبة 89%.
تحتل GLM-5.2 أعلى قيمة مقابل تكلفة على مستوى «الذكاء - تكلفة المهمة» ضمن حدود Pareto. نظرًا لأن متوسط إخراج المهمة الواحدة هو 43 ألف رمز (مقابل 26 ألفًا في GLM-5.1)، ارتفعت تكلفة المهمة الواحدة لـ GLM-5.2 إلى حوالي 0.46 دولار، أعلى من GLM-5.1 (0.25 دولار) وDeepSeek V4 Pro (max، 0.05 دولار)، لكنها لا تزال أقل بكثير من النماذج المغلقة المصدر في نفس فئة الذكاء.
يحتوي GLM-5.2 على 744 مليار معلمة، منها 40 مليار معلمة نشطة، وزاد حجم نافذة السياق من 200 ألف إلى مليون، ويتبع ترخيص MIT لفتح المصدر. حاليًا، تتوفر خدمة API الرسمية من 智谱 (بتسعير 1.4 للدخل و4.4 للإخراج / لكل مليون رمز) على منصات مثل SiliconFlow وDeepInfra وNebius AI.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت