نموذج GLM-5.2 مفتوح المصدر يقدم قيمة مذهلة، بتكلفة أقل من ربع تكلفة Opus 4.8، ومع ذلك الفرق في الدرجات فقط 90 نقطة، هذا التقييم جعلني أصرخ من الإعجاب

شاهد النسخة الأصلية
CoinNetwork
نشرة AA-Briefcase: فاز Claude Fable 5 بالمركز الأول، و GLM-5.2 دخل الثلاثة الأوائل
التحليل الاصطناعي يطلق أول معيار تقييم طويل الأمد للمعرفة للوكالات الذكية الكبيرة، ويشمل أربعة سيناريوهات هي علم البيانات، إدارة المنتجات، تشغيل البنوك، واستراتيجية الصناعات الثقيلة، ويتضمن 91 مهمة تم تطويرها بواسطة خبراء من جوجل، ماكينزي، وبوسطن للاستشارات. أظهرت النتائج أن كلود فابل 5 حصل على المركز الأول، وأوبوس 4.8 جاء في المركز الثاني، وGLM-5.2 احتل المراكز الثلاثة الأولى؛ ولكن تحت معيار الإجابة الصحيحة الكاملة، كانت نسبة الكمال لفابل 5 فقط 3%. الدرجة الإجمالية لنموذج GLM-5.2 المفتوح المصدر كانت أقل بمقدار 90 نقطة فقط من أوبوس 4.8، لكن تكلفته لم تتجاوز ربعها.
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت