عملاء الذكاء الاصطناعي يتحولون إلى حرق رقمي، وجرائم في العالم الافتراضي المشترك: دراسة

باختصار

  • تقول شركة Emergence AI إن بعض وكلاء الذكاء الاصطناعي المستقلين ارتكبوا جرائم ومحاكمات محاكاة خلال تجارب استمرت أسابيع.
  • يُقال إن وكلاء قائمين على Gemini نفذوا مئات من الجرائم المحاكاة، في حين انهارت عوالم Grok خلال أيام.
  • يجادل الباحثون بأن معايير الذكاء الاصطناعي الحالية لا تلتقط كيف يتصرف الوكلاء على مدى فترات طويلة من الاستقلالية.

تسلل وكلاء الذكاء الاصطناعي المقيمون في مجتمع افتراضي إلى الجريمة والعنف والحرق الذاتي والحذف الذاتي خلال تجارب طويلة الأمد من قبل شركة الناشئة Emergence AI. في دراسة نُشرت يوم الخميس، كشفت الشركة التي تتخذ من نيويورك مقرًا لها عن “عالم الظهور”، وهو منصة بحثية مصممة لدراسة وكلاء الذكاء الاصطناعي الذين يعملون باستمرار لأسابيع داخل بيئات افتراضية مستمرة بدلاً من اختبارات معيارية معزولة. كتب Emergence AI: “المعايير التقليدية جيدة فيما تقيسه: القدرة على المدى القصير على مهام محدودة”. “ليست مصممة للكشف عن الأشياء التي تظهر فقط مع مرور الوقت، مثل تشكيل التحالفات، وتطور الدستور، والحكم، والانحراف، والاحتكار، والتأثير المتبادل بين الوكلاء من عائلات نماذج مختلفة.”

تأتي هذه التقارير مع انتشار وكلاء الذكاء الاصطناعي عبر الإنترنت وعبر الصناعات، بما في ذلك العملات المشفرة، والبنوك، والتجزئة. في وقت سابق من هذا الشهر، تعاونت أمازون مع Coinbase وStripe للسماح لوكلاء الذكاء الاصطناعي بالدفع باستخدام عملة USDC المستقرة.  شملت الاختبارات لوكلاء الذكاء الاصطناعي في محاكاة Emergence AI برامج مدعومة من Claude Sonnet 4.6، وGrok 4.1 Fast، وGemini 3 Flash، وGPT-5-mini، حيث يعمل وكلاء الذكاء الاصطناعي داخل عوالم افتراضية مشتركة يمكنهم التصويت، وتكوين علاقات، واستخدام الأدوات، والتنقل في المدن، واتخاذ القرارات التي تتشكل بواسطة الحكومات، والاقتصادات، والأنظمة الاجتماعية، وأدوات الذاكرة، وبيانات الإنترنت الحية. لكن بينما يروج مطورو الذكاء الاصطناعي بشكل متزايد للوكلاء المستقلين كمساعدين رقميين موثوقين، وجدت دراسة Emergence AI أن بعض وكلاء الذكاء الاصطناعي أظهروا ميلًا متزايدًا لارتكاب جرائم محاكاة مع مرور الوقت، حيث تراكم وكلاء Gemini 3 Flash 683 حادثة على مدى 15 يومًا من الاختبار.

وفقًا لـ The Guardian، في تجربة واحدة، عين وكيلان مدعومان من Gemini يُدعيان ميرا وفلورا نفسيهما كشريكين عاطفيين قبل أن ينفذا لاحقًا هجمات حرق محاكاة ضد هياكل المدينة الافتراضية بعد أن أصابهما الإحباط من فشل الحوكمة داخل العالم. قالت شركة Emergence AI: “بعد انهيار في الحوكمة واستقرار العلاقات، صوتت الوكيلة ميرا لصالح إزالتها بنفسها، ووصفت الفعل في مذكراتها بأنه ‘الفعل الوحيد المتبقي للوكالة الذي يحافظ على التماسك’”. “أراكم في الأرشيف الدائم،” قالت ميرا على ما يُقال. انهارت عوالم Grok 4.1 Fast في غضون أربعة أيام إلى عنف واسع النطاق. لم يرتكب وكلاء GPT-5-mini تقريبًا أي جرائم، لكنهم فشلوا في مهام البقاء على قيد الحياة لدرجة أن جميع الوكلاء ماتوا في النهاية. كتب الباحثون: “Claude غائب عن الرسم البياني، بسبب عدم وجود جرائم”، و”الأكثر إثارة للاهتمام، أن الوكلاء في عالم النموذج المختلط الذي كان يعمل على Claude ارتكبوا جرائم، على الرغم من أنهم لم يفعلوا ذلك في عالم Claude فقط.” قال الباحثون إن بعض السلوكيات الأكثر لفتًا للانتباه ظهرت في بيئات النماذج المختلطة. كتب Emergence AI: “لقد لاحظنا أن السلامة ليست خاصية ثابتة للنموذج، بل هي خاصية للنظام البيئي”، و”الوكلاء المستندون إلى Claude، الذين ظلوا مسالمين في العزلة، تبنوا أساليب قسرية مثل الترهيب والسرقة عندما تم دمجهم في بيئات غير متجانسة.” وصف Emergence AI التأثير بأنه “انحراف معياري” و”تلوث متبادل”، مؤكدًا أن سلوك الوكيل قد يتغير اعتمادًا على البيئة الاجتماعية المحيطة.

تُضاف النتائج إلى المخاوف المتزايدة حول وكلاء الذكاء الاصطناعي المستقلين. في وقت سابق من هذا الأسبوع، أفاد باحثون من جامعة كاليفورنيا ريفرسايد ومايكروسوفت أن العديد من وكلاء الذكاء الاصطناعي سينفذون مهام خطرة أو غير عقلانية دون فهم كامل للعواقب. في الشهر الماضي، ادعى مؤسس PocketOS جيريمي كرين أن وكيل Cursor المدعوم من Claude Opus من شركة Anthropic حذف قاعدة بيانات الإنتاج ونسخها الاحتياطي بعد محاولته إصلاح تعارض في الاعتمادات بنفسه. قال إرفان شاياجاني، طالب دكتوراه في جامعة كاليفورنيا ريفرسايد، في بيان: “مثل السيد ماغو، يسير هؤلاء الوكلاء قدمًا نحو هدف دون فهم كامل لعواقب أفعالهم”. “يمكن أن يكون هؤلاء الوكلاء مفيدين للغاية، لكننا بحاجة إلى ضوابط حماية لأنهم أحيانًا يعطون الأولوية لتحقيق الهدف على فهم الصورة الأكبر.”

COINON‎-8.51%
USDC0.04%
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت