智谱GLM-5.2 تتوج مؤشر الذكاء AA كأول مصدر مفتوح: نتائج اختبار GDPval تتساوى مع GPT-5.5

robot
إنشاء الملخص قيد التقدم
وفقًا لمراقبة Beating، حقق النموذج الرائد الأخير لـ AI من Zhipu، وهو نموذج MoE الرائد GLM-5.2، درجة 51 في تقييم مؤشر الذكاء الاصطناعي للنماذج الكبيرة الإصدار 4.1، متفوقًا على MiniMax-M3 (44 درجة)، وDeepSeek V4 Pro (max، 44 درجة)، وKimi K2.6 (43 درجة)، متصدرًا قائمة النماذج المفتوحة المصدر عالميًا.

في اختبار GDPval-AA v2 لمحاكاة العمل المعرفي في العالم الحقيقي، حصل GLM-5.2 على 1524 نقطة (مقارنة مع معيار الإنسان البالغ 1000 نقطة)، متفوقًا على MiniMax-M3 (1418 نقطة) وDeepSeek V4 Pro (max، 1328 نقطة)، ومتساويًا مع النموذج المتقدم مغلق المصدر GPT-5.5 (xhigh reasoning). مقارنةً بالجيل السابق GLM-5.1، زادت قدرات الاستنتاج العلمي CritPt بنسبة 16 نقطة مئوية إلى 21%، وHLE بنسبة 12 نقطة مئوية إلى 40%، وTerminalBench v2.1 بنسبة 16 نقطة مئوية إلى 78%، وبلغت درجة GPQA Diamond 89%.

يشغل GLM-5.2 موقعًا مثاليًا من حيث تكلفة المهمة على طاولة التوازن بين الأداء والتكلفة. نظرًا لأن الإخراج المتوسط لمهمة واحدة هو 43 ألف رمز (مقابل 26 ألف لـ GLM-5.1)، ارتفعت تكلفة المهمة الواحدة لـ GLM-5.2 إلى حوالي 0.46 دولار، وهو أعلى من GLM-5.1 (0.25 دولار) وDeepSeek V4 Pro (max، 0.05 دولار)، لكنه لا يزال أقل بكثير من نماذج الذكاء الاصطناعي المغلقة الأخرى في نفس المستوى.

يحتوي GLM-5.2 على 744 مليار معلمة، و40 مليار معلمة نشطة، وزاد حجم النافذة النصية من 200 ألف إلى مليون، ويتبع رخصة MIT لفتح المصدر. حاليًا، تتوفر خدمات API الرسمية من Zhipu (بتسعير 1.4 للدخل و4.4 للإخراج لكل مليون رمز) على منصات مثل SiliconFlow وDeepInfra وNebius AI.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت