تقييم مستقل يُظهر أن MiniMax M2.7 يُضاهي النماذج الرائدة المغلقة المصدر في المهام الأساسية للذكاء الاصطناعي

robot
إنشاء الملخص قيد التقدم

أخبار ME، في 5 أبريل (UTC+8)، في الآونة الأخيرة، ووفقًا للتقييم المستقل من LangChain، حقق نموذج الأوزان المفتوحة MiniMax M2.7 مستوى مماثلًا تقريبًا لمستوى النماذج الرائدة المغلقة المصدر في مهام الوكلاء الأساسية مثل عمليات التعامل مع الملفات واستدعاء الأدوات واتباع التعليمات. وترى الآراء المذكورة في المقال أن ميزة ذلك تكمن في خفض التكاليف بشكل ملحوظ بنحو 20 ضعفًا، مع زيادة السرعة بمقدار 2-4 مرات. وعلى سبيل المثال، عند الإخراج اليومي بمقدار 10 ملايين توكن، فإن تكلفة استخدام Opus 4.6 تبلغ حوالي 250 دولارًا في اليوم، بينما لا يحتاج MiniMax M2.7 إلا إلى حوالي 12 دولارًا في اليوم. وقد تحقق هذا التقدم بفضل دفع معايير مفتوحة مثل SWE-Rebench وTerminal Bench 2.0، مما يجعل نماذج الأوزان المفتوحة خيارًا قابلاً للتطبيق لنشر الوكلاء في بيئات الإنتاج، ويمكن استخدامها جنبًا إلى جنب مع النماذج المغلقة المصدر. (المصدر: InFoQ)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.23Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.22Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.22Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.23Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:0
    0.00%
  • تثبيت