ARC-AGI-3 يعلن عن أكبر اختبار للبشر في التاريخ: تم التغلب على جميع المستويات بواسطة البشر، والذكاء الاصطناعي لا يزال لديه فجوة

robot
إنشاء الملخص قيد التقدم

معلومات أخبار ME، في 15 أبريل (بتوقيت UTC+8)، وفقًا لمراقبة Beating، أعلنت مؤسسة ARC Prize عن مجموعة بيانات أداء الإنسان لـ ARC-AGI-3، وهي أكبر دراسة اختبار بشري حتى الآن ضمن سلسلة ARC-AGI، بمشاركة 458 شخصًا. تحتوي مجموعة البيانات على 342 سجلًا كاملًا لتشغيل الإنسان، تغطي 25 بيئة عامة، وتم فتحها جميعًا للمصدر. يتضمن ARC-AGI-3 135 بيئة استنتاج تجريدية، حيث لا يتلقى المختبرون أي شرح للعبة، ويجب عليهم استكشاف القواعد، واستنتاجها، ووضع استراتيجيات بأنفسهم. تُجرى الاختبارات في مركز اختبار حضري في سان فرانسيسكو، وتستمر كل جلسة 90 دقيقة، ويحصل المشاركون على حوالي 130 دولارًا كأجر أساسي بالإضافة إلى 5 دولارات عن كل بيئة يتم اجتيازها. جميع الاختبارات تتم تحت شرط “المرور الأول”، أي أن كل شخص يشاهد مرة واحدة ويحاول مرة واحدة فقط، ويقيس ذلك قدرة التعلم والتكيف عند مواجهة مشكلات جديدة. يحصل الإنسان والذكاء الاصطناعي على نفس المعلومات تمامًا، دون أي فرق في المعلومات. الاستنتاج الرئيسي: تم اجتياز جميع بيئات ARC-AGI-3 من قبل البشر، حيث أكمل كل بيئة على الأقل اثنين من المشاركين المستقلين، ومعظم البيئات تم اجتيازها من قبل أكثر من خمسة أشخاص. وتقول مؤسسة ARC Prize: “لم نحقق بعد الذكاء الاصطناعي العام، وهذه البيانات هي الدليل”. منذ أن تم عرض معاينة ARC-AGI-3، تلقت البيئات العامة ما يقرب من مليون تقييم من الذكاء الاصطناعي. استنادًا إلى هذه البيانات، أعلنت المؤسسة عن تعديلين في قواعد التقييم: الأول هو تغيير معيار الأداء البشري من “أفضل لاعب ثاني” إلى “متوسط اللاعب”، لتقليل تأثير الحظ على النتيجة؛ والثاني هو رفع الحد الأقصى لنقاط كل مهمة من 100% إلى 115%، لتجنب أن تؤثر أداء ضعيف في مهمة واحدة على الأداء الكلي. الأثر الصافي للتعديلين هو ارتفاع درجات الإنسان والذكاء الاصطناعي بشكل طفيف حوالي 0.5 نقطة مئوية. (المصدر: BlockBeats)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت