Opus 4.6/4.7 يهدفان إلى تعويض النقص في الرياضيات ليصبحوا على قدم المساواة مع قدرات البرمجة، ومؤشر ECI هذا مثير للاهتمام — فهو يقيس الصعوبة النسبية بين النماذج، وليس بالمقارنة مع البشر، لذلك لا تخلط بينه وبين «تجاوز البشر في الرياضيات»

شاهد النسخة الأصلية
MeNews
إيبك AI تصدر خريطة التخصصات لClaude: مهارة كتابة الكود لا تزال قوية، وOpus 4.6 و 4.7 قد سدوا الثغرات في الرياضيات
تحليل مؤشر القدرات الخاصة بالنطاق لـ Epoch AI يُظهر أن سلسلة Claude تتفوق على المدى الطويل في كتابة الشفرات، لكن قدراتها الرياضية ضعيفة نسبياً؛ وتشير البيانات الأحدث إلى أن هذا التخصص يتعافى بسرعة. سابقًا، كانت Claude تتفوق على المتوسط في SWE-ECI، وكان هناك فجوة مع Math-ECI، لكن إصدار Opus 4.6/4.7 قلل الفجوة إلى أقل من نقطة واحدة، مما يعالج النقص. يعكس مؤشر ECI مدى صعوبة المهام بالنسبة للنماذج مقارنة بالبشر، وليس مدى صعوبة المهام على الإنسان.
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت