Epoch AI Research تقييم أداء النموذج الجديد Meta Muse Spark على معيار FrontierMath

robot
إنشاء الملخص قيد التقدم

أخبار ME، في 9 أبريل (UTC+8)، حصلت Epoch AI Research مؤخرًا على وصول مُسبق إلى نموذج Meta الجديد Muse Spark، وقامت بتقييمه على معيار FrontierMath. تُظهر نتائج التقييم أن درجات Muse Spark في المراتب من 1 إلى 3 تبلغ 39%، بينما تبلغ في المرتبة 4 15%. ووفقًا للمنظور المذكور في المقال، فإن هذا الأداء يُعد تنافسيًا مقارنةً بعدة نماذج رائدة حديثة، لكنه يتراجع عن GPT-5.4. (المصدر: InFoQ)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.26Kعدد الحائزين:2
    0.00%
  • القيمة السوقية:$2.24Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.24Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.3Kعدد الحائزين:2
    0.19%
  • القيمة السوقية:$2.25Kعدد الحائزين:0
    0.00%
  • تثبيت