بعد أن تجاوزت شركة أنثروبيك أداء نموذجها الذكي الاصطناعي Claude Opus 4.5 لأفضل المرشحين البشريين، أعادت تصميم اختبار البرمجة المنزلي للمتقدمين للوظائف. اكتشف فريق تحسين الأداء في مختبر الذكاء الاصطناعي بقيادة تريستان هيو أنهم غير قادرين على تمييز أفضل المتقدمين للوظائف عن الأعمال التي أنجزها الذكاء الاصطناعي بمساعدة الإنسان بدون مراقبة مباشرة. يركز الاختبار الجديد على مشكلة تحسين الأجهزة الجديدة التي تهدف إلى إحباط أدوات الذكاء الاصطناعي الحالية. كما كشف هيو عن النسخة القديمة من الاختبار ودعا أي شخص يمكنه التفوق على Claude Opus 4.5 للتواصل مع الشركة.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.45Kعدد الحائزين:2
    0.06%
  • القيمة السوقية:$2.42Kعدد الحائزين:0
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.41Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • تثبيت