Epoch AI Research تقييم أداء النموذج الجديد Meta Muse Spark على معيار FrontierMath

robot
إنشاء الملخص قيد التقدم

أخبار ME، 9 أبريل (بتوقيت UTC+8)، حصلت شركة Epoch AI Research مؤخرًا على حق الوصول المسبق لنموذج Meta الجديد Muse Spark وقامت بتقييمه على مقياس FrontierMath. أظهرت نتائج التقييم أن Muse Spark حصلت على درجة 39٪ في المستويات 1-3، و15٪ في المستوى 4. وفقًا للآراء الواردة في النص، فإن هذا الأداء يتنافس مع العديد من النماذج الرائدة مؤخرًا، لكنه يتخلف عن GPT-5.4. (المصدر: InFoQ)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت