تقييم مستقل يُظهر أن MiniMax M2.7 يُضاهي النماذج الرائدة المغلقة المصدر في المهام الأساسية للذكاء الاصطناعي

robot
إنشاء الملخص قيد التقدم

رسالة ME News، في 5 أبريل (UTC+8)، ووفقًا للتقييم المستقل الذي أجرته LangChain مؤخرًا، فقد وصل نموذج الأوزان المفتوحة MiniMax M2.7 إلى مستوى مماثل تقريبًا لمستوى النماذج الرائدة المغلقة المصدر في مهام العُملاء الأساسية مثل عمليات التعامل مع الملفات واستدعاء الأدوات واتباع التعليمات. وترى وجهة النظر الواردة في المقال أن ميزته تكمن في خفض التكلفة بشكل ملحوظ بنحو 20 مرة، مع زيادة السرعة بمقدار 2-4 مرات. وعلى سبيل المثال، وبافتراض إنتاج 10 ملايين رمز يوميًا، فإن تكلفة استخدام Opus 4.6 تبلغ حوالي 250 دولارًا يوميًا، بينما يحتاج MiniMax M2.7 إلى حوالي 12 دولارًا يوميًا فقط. ويُعزى هذا التقدم إلى دفع الاختبارات/المعايير المفتوحة مثل SWE-Rebench وTerminal Bench 2.0، مما يجعل النماذج المفتوحة خيارًا قابلاً للتطبيق لنشر العُملاء في بيئات الإنتاج، ويمكن استخدامها أيضًا بالتزامن مع النماذج المغلقة. (المصدر: InFoQ)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.23Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.32Kعدد الحائزين:3
    0.52%
  • القيمة السوقية:$2.24Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.25Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • تثبيت