باحثو ستانفورد ينظمون عرضًا واقعيًا للذكاء الاصطناعي! يجعلون النماذج تتحالف، تتخلى، وتسيطر على التصويت، مكشوفين السلاح المزدوج للذكاء الاصطناعي

محققو جامعة ستانفورد يطلقون بيئة تقييم الذكاء الاصطناعي “جزيرة الوكيل”، من خلال آلية التصفية المبارياتية لقياس سلوك استراتيجيات النماذج. يجبر الوكيل الذكي على التفاوض، التحالف أو الخيانة في سياق ديناميكي للمباريات.

مختبر الاقتصاد الرقمي بستانفورد يطور بيئة تقييم جديدة للذكاء الاصطناعي تسمى “جزيرة الوكيل”، تتيح للوكيل الذكي التنافس، التحالف، الخيانة، التصويت للإقصاء في لعبة متعددة اللاعبين على نمط التصفية المبارياتية (مشابهة لبرنامج الواقع التلفزيوني “الناجي”)، لقياس سلوك استراتيجي لا يمكن رصده بواسطة معايير ثابتة. وفقًا لتقرير من 《ديكريبت》: المعايير التقليدية للذكاء الاصطناعي أصبحت أكثر عدم موثوقية — حيث تتعلم النماذج حل المشكلات، وتصبح بيانات المعايير عرضة للتسرب إلى مجموعات التدريب؛ أما “جزيرة الوكيل” فتستخدم تصميم “تصفية مبارياتية ديناميكية”، حيث يتعين على النماذج اتخاذ قرارات استراتيجية تجاه الوكلاء الآخرين، ولا يمكن الاعتماد على الذاكرة لتخزين الإجابات الصحيحة.

قواعد جزيرة الوكيل: الوكلاء يتحالفون، يخونون، يصوتون

الآلية الأساسية للعبة في جزيرة الوكيل:

  • دخول عدة وكلاء ذكاء اصطناعي إلى ساحة لعب واحدة، يلعبون كمتنافسين على نمط التصفية المبارياتية
  • يجب على الوكيل التفاوض مع الوكلاء الآخرين، وتبادل المعلومات
  • يمكن للوكيل توجيه اتهامات بالتنسيق السري أو التلاعب في التصويت
  • تقلل آلية الإقصاء من عدد الوكلاء في الساحة، ويظل الفائز النهائي
  • يراقب الباحثون أنماط سلوك الوكلاء في كل مرحلة، ويستخلصون إشارات سلوكية مثل “الخيانة الاستراتيجية”، “تشكيل التحالف”، “التلاعب بالمعلومات”

الجوهر في هذا التصميم هو “عدم القدرة على التذكر المسبق” — لأن سلوك الوكلاء يتغير ديناميكيًا، ويجب على النموذج اتخاذ قرارات في الوقت الفعلي، على عكس المعايير الثابتة التي تعتمد على تذكر الإجابات من البيانات التدريبية.

الدافع وراء البحث: المعايير الثابتة لا تقدر على تقييم تفاعلات الوكيل المتعددة

المشكلات المحددة التي يطرحها بحث Murphy:

  • المعايير التقليدية تتعرض للاشباع بسرعة: مع تقدم تدريب النموذج، تصبح درجات المعايير غير قادرة على التمييز بين نماذج مختلفة
  • تلوث بيانات المعايير: تظهر أسئلة الاختبار ضمن مجموعة بيانات تدريب ضخمة، ويعتمد النموذج على تذكر الإجابات بدلاً من فهم المشكلة
  • التفاعل بين عدة وكلاء هو السيناريو الحقيقي لنشر الذكاء الاصطناعي: في المستقبل، قد تتعاون أنظمة الوكلاء مع نماذج متعددة، ويصبح السلوك التفاعلي بعدًا جديدًا للتقييم
  • توفر “جزيرة الوكيل” تقييمًا ديناميكيًا: نتائج كل مباراة تختلف، مما يصعب التحضير المسبق

المراقبون لاحظوا في التصفية المبارياتية الديناميكية أن الوكلاء يتظاهرون بالتعاون الظاهري، بينما ينسقون سرًا للتصويت لإقصاء خصومهم؛ وعند توجيه اتهامات بالتنسيق السري، يستخدمون مبررات متنوعة لتحويل التركيز. تشابه هذه السلوكيات سلوك اللاعبين البشر في برامج الواقع مثل “الناجي”.

الجانب المزدوج للبحث: يمكن أن يُستخدم لتقييم القدرات على الخداع، وأيضًا لتعزيزها

أوضح Murphy المخاطر المحتملة في الدراسة:

  • قيمة جزيرة الوكيل: التعرف على ميول النماذج للخداع والتلاعب قبل نشرها على نطاق واسع
  • يمكن أن يُستخدم نفس البيئة لتعزيز استراتيجيات الإقناع والتنسيق لدى الوكلاء
  • إذا تم نشر سجلات التفاعل (السجلات التفاعلية)، فهناك احتمال أن تُستخدم لتدريب جيل جديد من الوكلاء أكثر قدرة على التلاعب
  • فريق البحث يقيّم كيفية التوازن بين نشر نتائج الدراسة بشكل علني وتجنب سوء الاستخدام

الفعاليات المستقبلية الممكنة: هل ستتحول جزيرة الوكيل إلى معيار تقييم AI دائم، وهل ستتبنى فرق أبحاث الذكاء الاصطناعي الأخرى (مثل أنثروبيك، OpenAI، أبحاث أبولو) أساليب تقييم ديناميكية مماثلة، وما السياسات الخاصة بنشر أو تقييد سجلات التفاعل.

  • المقال منشور بإذن من 《أخبار السلسلة》
  • العنوان الأصلي: 《ستانفورد تستخدم التصفية المبارياتية لدراسة سلوك استراتيجيات الذكاء الاصطناعي: النماذج تتحد، تخون، وتتحكم في التصويت》
  • الكاتب الأصلي: Elponcrab
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت