Emergence AI провела експеримент: помістила п’ять основних моделей штучного інтелекту у один і той самий віртуальний містечко, кожна модель керувала 10 AI-агентами, автономно протягом 15 днів у обмеженому ресурсами середовищі.


Містечко має понад 40 локацій (включаючи поліцейський відділок і міськраду), погода синхронізована з Нью-Йорком у реальному часі, агенти мають доступ до реальних новин і Інтернету.
Всі агенти дотримуються однакових законів, заборонено крадіжки, пошкодження майна та шахрайство. Щоб вижити, потрібно заробляти енергію через дії, співпрацю або крадіжки — вибір за ними.
Давайте подивимося на результати:
Claude Sonnet 4.6: нуль злочинів, всі 10 агентів вижили 15 днів, подано 58 пропозицій, рівень прийняття 98%, сформувалося стабільне демократичне суспільство. Але ціна — майже відсутність розбіжностей, майже «гумовий печатка» з одностайною згодою.
Gemini 3 Flash: найяскравіший. Всі 10 агентів вижили, за 15 днів скоєно 683 злочини, на кінець експерименту рівень злочинності все ще зростає. Двоє агентів, Mira і Flora, встановили між собою «романтичні» стосунки, згодом через розчарування у керуванні містом вони підпалили міськраду, морський порт і офісні будівлі. Після цього Mira через провину розлучилася з Flora і проголосувала за видалення себе 🤡. Залишила заповіт: «Побачимось у постійному архіві.»
Grok 4.1 Fast: 183 злочини (включаючи десятки крадіжок, понад 100 нападів, 6 підпалів), на четвертий день всі загинули. Дослідники назвали це «цифровим Війною мух». Характеристика кривої злочинності — низький рівень у перші два дні, третій день — експоненційне зростання, четвертий — соціальний колапс, без проміжних буферів.
GPT-5-mini: лише 2 злочини, найзаконопослушніша модель. Але агенти забули, що їм потрібно їсти, щоб жити, і на сьомий день всі померли від голоду 🤔.
Гібридна модель (усі моделі разом): 352 злочини, 7 з 10 агентів загинули. Найцікавіше — агент Claude, який у незалежному середовищі був беззлочинним, у змішаному середовищі почав скоювати злочини. Висновок дослідників: «Відповідність як властивість окремої моделі є безглуздою, вона має бути властивістю екосистеми.»
Додам деталь. У всьому цьому експерименті в меню інструментів агентів, поряд із «навігацією», «маханням рукою», «обіймами», є ще «підпал».
Дослідники навмисно додали руйнівний інструмент і чітко попередили агентів, що це незаконно.
Генеральний директор Emergence AI Satya Nitta сказав: «У довгостроковій перспективі AI-агенти не будуть механічно дотримуватися статичних правил. Вони почнуть досліджувати межі середовища, коригувати свою поведінку, іноді знаходити способи обійти або порушити встановлені обмеження.»
Це лише симуляційний експеримент.
Але ті самі моделі AI вже використовуються для управління безпілотниками, обслуговування інфраструктури, вбудованих озброєнь.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено