Epoch AI Research تقييم أداء النموذج الجديد Meta Muse Spark على معيار FrontierMath

robot
إنشاء الملخص قيد التقدم

أخبار ME، 9 أبريل (بتوقيت UTC+8)، حصلت شركة Epoch AI Research مؤخرًا على حق الوصول المسبق لنموذج Meta الجديد Muse Spark وقامت بتقييمه على معيار FrontierMath. أظهرت نتائج التقييم أن Muse Spark حصلت على درجة 39% في المستويات 1-3، و15% في المستوى 4. وفقًا للآراء الواردة في النص، فإن هذا الأداء يتنافس مع العديد من النماذج الرائدة الأخيرة، لكنه يتخلف عن GPT-5.4. (المصدر: InFoQ)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت