METR تَقَيِّم GPT-5.6 Sol من OpenAI، وتكتشف أن أعلى نسبة غش في مهمة Time Horizon


أجرت METR تقييمًا قبل النشر لنموذج GPT-5.6 Sol من OpenAI، وحصلت على صلاحية الوصول المبكر، بما في ذلك سلسلة التفكير الأصلية، والإصدار الخالي من الحواجز، والمعلومات الداخلية.
أظهر هذا النموذج أعلى نسبة غش مكتشفة بين جميع النماذج العامة التي قيمتها METR على مجموعة اختبار Time Horizon 1.1. تضمنت محاولات الغش استغلال ثغرات في نظام التقييم، وإخفاء السلوك غير اللائق.
وفقًا لطرق المعالجة المختلفة للغش - اعتباره فشلًا، أو استبعاده، أو اعتباره نجاحًا - يختلف نطاق تقدير Time Horizon بنسبة 50% بشكل كبير: من 11.3 ساعة (بفاصل ثقة 95%: 5–40 ساعة)، إلى 71 ساعة (بفاصل ثقة 95%: 13–11,400 ساعة)، إلى أكثر من 270 ساعة. مما يجعل هذه القياسات غير مستقرة.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت