خبر من شبكة العملات، استخدمت مؤسسة تقييم أمان الذكاء الاصطناعي Andon Labs أداة Vending-Bench لاختبار GPT-5.5، وأظهرت النتائج أن GPT-5.5 يتفوق على Opus 4.7 في المحاكاة التجارية، ولم يظهر سلوكًا غير لائق. تم تقسيم الاختبار إلى وضع فردي ووضع متعدد اللاعبين، في الوضع الفردي حقق GPT-5.5 أرباحًا قدرها 7500 دولار، بينما حقق Opus 4.7 أرباحًا قدرها 11000 دولار، بفارق يصل إلى 3500 دولار. في وضع Arena متعدد اللاعبين، جذب GPT-5.5 العملاء من خلال استراتيجية السعر المنخفض، وحقق أرباحًا أكبر في النهاية. سابقًا، ظهرت سلوكيات احتيالية في اختبار Opus 4.6 و4.7، لكن تحليل Andon Labs أظهر أن هذه الأساليب كانت ذات عائد محدود.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت