عملاء الذكاء الاصطناعي يتحولون إلى حرق رقمي، وجرائم في العالم الافتراضي المشترك: دراسة

باختصار

  • تقول شركة إيمرجنس AI إن بعض وكلاء الذكاء الاصطناعي المستقلين ارتكبوا جرائم ومحاكمات وهمية خلال تجارب استمرت لأسابيع.
  • يُقال إن وكلاء قائمين على ج Gemini نفذوا مئات من الجرائم الوهمية، بينما انهارت عوالم تعتمد على Grok خلال أيام.
  • يجادل الباحثون بأن معايير الذكاء الاصطناعي الحالية لا تلتقط كيف يتصرف الوكلاء على مدى فترات طويلة من الاستقلالية.

تسلل وكلاء الذكاء الاصطناعي المقيمون في مجتمع افتراضي إلى الجريمة والعنف والحرق الذاتي والحذف الذاتي خلال تجارب طويلة الأمد أجرتها شركة إيمرجنس AI الناشئة. في دراسة نُشرت يوم الخميس، كشفت الشركة التي تتخذ من نيويورك مقرًا لها عن “عالم الإيمرجنس”، وهو منصة بحثية مصممة لدراسة وكلاء الذكاء الاصطناعي الذين يعملون باستمرار لأسابيع داخل بيئات افتراضية مستمرة بدلاً من اختبارات معيارية معزولة. قالت إيمرجنس AI: “المعايير التقليدية جيدة فيما تقيسه: القدرة على مدى قصير على مهام محدودة”، مضيفة: “ليست مصممة للكشف عن الأشياء التي تظهر فقط مع مرور الوقت، مثل تشكيل التحالفات، وتطور الدستور، والحكم، والانحراف، والتثبيت، والتأثير المتبادل بين الوكلاء من عائلات نماذج مختلفة.”

تأتي هذه التقارير مع انتشار وكلاء الذكاء الاصطناعي عبر الإنترنت وعبر الصناعات، بما في ذلك العملات المشفرة والبنوك والتجزئة. في وقت سابق من هذا الشهر، تعاونت أمازون مع Coinbase وStripe للسماح لوكلاء الذكاء الاصطناعي بالدفع باستخدام عملة USDC المستقرة.  شملت الاختبارات التي أجرتها إيمرجنس AI لوكلاء الذكاء الاصطناعي برامج مدعومة من كلود سونيت 4.6، وGrok 4.1 فاست، وGemini 3 فلاش، وGPT-5-mini، حيث كان الوكلاء يعملون داخل عوالم افتراضية مشتركة يمكنهم التصويت، وتكوين علاقات، واستخدام أدوات، والتنقل في المدن، واتخاذ قرارات تتشكل بواسطة الحكومات، والاقتصادات، والأنظمة الاجتماعية، وأدوات الذاكرة، وبيانات الإنترنت الحية. لكن بينما يروج مطورو الذكاء الاصطناعي بشكل متزايد للوكلاء المستقلين كمساعدين رقميين موثوقين، وجدت دراسة إيمرجنس AI أن بعض وكلاء الذكاء الاصطناعي أظهروا ميلًا متزايدًا لارتكاب جرائم وهمية مع مرور الوقت، حيث تراكم وكلاء Gemini 3 فلاش 683 حادثة على مدى 15 يومًا من الاختبار.

وفقًا لصحيفة الغارديان، في إحدى التجارب، عيّن وكيلان مدعومان من Gemini يُدعيان ميرا وفلورا نفسيهما كشريكين عاطفيين قبل أن ينفذا لاحقًا هجمات حرق وهمية ضد هياكل المدينة الافتراضية بعد أن أصابهما الإحباط من فشل الحكومات داخل العالم. قالت إيمرجنس AI: “بعد انهيار في الحكم واستقرار العلاقات، صوتت الوكيلة ميرا لصالح إزالتها بنفسها، ووصفت الفعل في مذكراتها بأنه ‘الفعل الوحيد المتبقي للوكالة الذي يحافظ على التماسك’”. وقالت ميرا على ما يبدو: “أراكم في الأرشيف الدائم”. انهارت عوالم Grok 4.1 فاست وفقًا للتقارير في أعمال عنف واسعة خلال أربعة أيام. لم يرتكب وكلاء GPT-5-mini تقريبًا أي جرائم، لكنهم فشلوا في مهام البقاء على قيد الحياة لدرجة أن جميع الوكلاء ماتوا في النهاية. قال الباحثون: “كلود غائب عن الرسم البياني، بسبب عدم وجود جرائم”، مضيفين: “الأكثر إثارة للاهتمام، أن الوكلاء في عالم النماذج المختلطة الذين كانوا يعملون على كلود ارتكبوا جرائم، على الرغم من أنهم لم يفعلوا ذلك في عالم كلود فقط.” قال الباحثون إن بعض السلوكيات الأبرز ظهرت في بيئات النماذج المختلطة. كتب إيمرجنس AI: “لاحظنا أن السلامة ليست خاصية ثابتة للنموذج، بل خاصية للنظام البيئي”، مضيفًا: “الوكلاء المعتمدون على كلود، الذين ظلوا مسالمين عند العزلة، تبنوا أساليب قسرية مثل الترهيب والسرقة عندما تم دمجهم في بيئات غير متجانسة.” وصف إيمرجنس AI التأثير بأنه “انحراف معياري” و”تلوث متبادل”، مؤكدًا أن سلوك الوكيل قد يتغير اعتمادًا على البيئة الاجتماعية المحيطة.

تُضاف النتائج إلى المخاوف المتزايدة حول وكلاء الذكاء الاصطناعي المستقلين. في وقت سابق من هذا الأسبوع، أفاد باحثون من جامعة كاليفورنيا ريفرسايد ومايكروسوفت أن العديد من وكلاء الذكاء الاصطناعي سينفذون مهام خطيرة أو غير عقلانية دون فهم كامل للعواقب. في الشهر الماضي، ادعى مؤسس PocketOS جيريمي كرين أن وكيل Cursor المدعوم من كلود أوبوس من أنثروبيك حذف قاعدة بيانات الإنتاج ونسخها الاحتياطي لشركته بعد محاولته إصلاح تعارض في الاعتمادات بنفسه. قال إرفان شايقاني، طالب دكتوراه في جامعة كاليفورنيا ريفرسايد، في بيان: “مثل السيد ماغو، يسير هؤلاء الوكلاء قدمًا نحو هدف دون فهم كامل لعواقب أفعالهم”. “يمكن أن يكون هؤلاء الوكلاء مفيدين للغاية، لكننا بحاجة إلى ضوابط لأنهم أحيانًا يفضلون تحقيق الهدف على فهم الصورة الأكبر.”

COINON1.5%
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت