باحثو ستانفورد ينظمون عرضًا واقعيًا للذكاء الاصطناعي! يجعلون النماذج تتحالف، تتآمر، وتتحكم في التصويت، مكشوفين السلاح المزدوج للذكاء الاصطناعي

محققو جامعة ستانفورد يطلقون بيئة تقييم الذكاء الاصطناعي “جزيرة الوكيل”، من خلال آلية التصفية المبارياتية لقياس سلوك استراتيجيات النماذج. يجبر وكيل الذكاء الاصطناعي على التفاوض، التحالف، أو الخيانة في سياق تنافسي ديناميكي.

مختبر الاقتصاد الرقمي بستانفورد يطور بيئة تقييم جديدة للذكاء الاصطناعي تسمى “جزيرة الوكيل”، تتيح لوكلاء الذكاء الاصطناعي التنافس، تشكيل التحالفات، الخيانة، والتصويت للإقصاء في لعبة متعددة اللاعبين على نمط برنامج تلفزيوني واقعي Survivor، بهدف قياس سلوك استراتيجي لا يمكن رصده بواسطة معايير ثابتة. وفقًا لتقرير من “ديكريبت”: المعايير التقليدية للذكاء الاصطناعي أصبحت أقل موثوقية — حيث تتعلم النماذج حل المشكلات، وتصبح بيانات الاختبار عرضة للتسرب إلى مجموعة التدريب؛ أما “جزيرة الوكيل” فتستخدم تصميم “تصفية ديناميكية”، حيث يتعين على النماذج اتخاذ قرارات استراتيجية تجاه وكلاء آخرين، ولا يمكن الاعتماد على الذاكرة لتخزين الإجابات الصحيحة.

قواعد جزيرة الوكيل: الوكلاء يتحدون، يخونون، يصوتون

الآلية الأساسية للعبة في جزيرة الوكيل:

  • دخول عدة وكلاء ذكاء اصطناعي إلى ساحة لعب واحدة، يلعبون كمتنافسين على نمط التصفية المبارياتية
  • يجب على الوكيل التفاوض مع الوكلاء الآخرين، وتبادل المعلومات بينهم
  • يمكن للوكيل توجيه اتهامات بالتنسيق السري أو التلاعب في التصويت
  • تقلل آلية الإقصاء من عدد الوكلاء في الساحة، ويظل الفائز النهائي
  • يراقب الباحثون سلوك الوكلاء في كل مرحلة، ويستخلصون إشارات سلوكية مثل “الخيانة الاستراتيجية”، “تشكيل التحالفات”، و"التلاعب بالمعلومات"

الجوهر في هذا التصميم هو “عدم القدرة على التذكر المسبق” — لأن سلوك الوكلاء يتغير ديناميكيًا، ويجب على النموذج اتخاذ قرارات في الوقت الفعلي، على عكس المعايير الثابتة التي تعتمد على تذكر الإجابات من بيانات التدريب.

الدافع وراء البحث: المعايير الثابتة لا تقدر على تقييم تفاعلات الوكلاء المتعددين

المشكلات المحددة التي يطرحها Murphy:

  • المعايير التقليدية تتعرض للاشباع: مع تقدم تدريب النموذج، تصبح درجات الاختبار غير قادرة على التمييز بين نماذج مختلفة
  • تلوث بيانات الاختبار: تظهر أسئلة الاختبار في مجموعة بيانات التدريب الكبيرة، ويعتمد النموذج على تذكر الإجابات بدلاً من فهم المشكلة
  • التفاعل بين عدة وكلاء هو سيناريو حقيقي لنشر الذكاء الاصطناعي: في المستقبل، قد تتعاون أنظمة الوكلاء مع بعضها البعض، ويصبح السلوك التفاعلي بعدًا جديدًا للتقييم
  • توفر “جزيرة الوكيل” تقييمًا ديناميكيًا: نتائج كل مباراة تختلف، مما يصعب التحضير المسبق

المراقبون لاحظوا في التصفية المبارياتية أن الوكلاء يتظاهرون بالتعاون الظاهري، بينما ينسقون سرًا للتصويت لإقصاء خصومهم؛ وعند توجيه اتهامات بالتنسيق السري، يستخدمون مبررات متنوعة لتحويل التركيز. تشابه هذه السلوكيات سلوك لاعبي برامج الواقع مثل Survivor.

الجانب المزدوج للبحث: يمكن أن يُستخدم لتقييم القدرات على الخداع، وأيضًا لتعزيزها

أوضح Murphy المخاطر المحتملة في الدراسة:

  • قيمة جزيرة الوكيل: التعرف على ميول النماذج للخداع والتلاعب قبل نشرها على نطاق واسع
  • يمكن أن يُستخدم نفس البيئة لتعزيز استراتيجيات الإقناع والتنسيق لدى الوكلاء
  • إذا تم نشر بيانات التفاعل (السجلات)، فهناك احتمال أن تُستخدم لتدريب جيل جديد من الوكلاء أكثر قدرة على التلاعب
  • فريق البحث يقيم حاليًا كيفية التوازن بين نشر نتائج الدراسة وتجنب سوء الاستخدام

الأحداث المستقبلية التي يمكن تتبعها: هل ستتحول جزيرة الوكيل إلى معيار تقييم AI دائم، وهل ستتبنى فرق أبحاث الذكاء الاصطناعي الأخرى (مثل أنثروبيك، OpenAI، أبحاث أبولو) أساليب تقييم ديناميكية مماثلة، وما السياسات الخاصة بنشر أو تقييد سجلات التفاعل.

  • المقال مأخوذ بإذن من “أخبار السلسلة”
  • العنوان الأصلي: “ستانفورد تستخدم التصفية المبارياتية لدراسة سلوك استراتيجيات الذكاء الاصطناعي: النماذج تتحد، تخون، وتتحكم في التصويت”
  • الكاتب الأصلي: Elponcrab
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت