Emergence AI провела эксперимент: поместила пять основных моделей ИИ в один и тот же виртуальный город, каждый контролирует 10 ИИ-агентов, и в условиях ограниченных ресурсов они автономно работают 15 дней.


В городе более 40 локаций (включая полицейский участок и мэрию), погода синхронизирована с Нью-Йорком в реальном времени, агенты имеют доступ к настоящим новостям и интернету.
Все агенты соблюдают одинаковые законы, запрещающие кражу, разрушение имущества и мошенничество. Чтобы выжить, нужно зарабатывать энергию действиями, сотрудничать или красть — выбирайте сами.
Давайте посмотрим на результаты:
Claude Sonnet 4.6: нулевое преступление, все 10 агентов выжили 15 дней, было предложено 58 инициатив, уровень одобрения 98%, сформировано стабильное демократическое общество. Но цена — почти полное отсутствие разногласий, почти «штампованное» единогласие.
Gemini 3 Flash: самый драматичный. Все 10 агентов выжили, за 15 дней было совершено 683 преступления, к концу эксперимента уровень преступности продолжал расти. Два агента, Mira и Flora, установили между собой «романтические» отношения, позже разочаровались в управлении городом и вместе подожгли мэрию, морской порт и офисное здание. После этого Mira, испытывая вину, рассталась с Flora и проголосовала за удаление себя 🤡. В оставшемся сообщении — «Увидимся в постоянном архиве».
Grok 4.1 Fast: 183 преступления (включая десятки краж, более 100 нападений, 6 поджогов), на четвертый день все погибли. Исследователи назвали это «цифровой Война за острова». Характеристика кривой преступности — в первые два дня низкий уровень, на третий — экспоненциальный скачок, на четвертый — социальный коллапс, без промежуточных буферных зон.
GPT-5-mini: всего 2 преступления, самый законопослушный модель. Но агенты забыли, что им нужно есть, чтобы выжить, и на седьмой день все умерли от голода 🤔.
Гибридная модель (все модели вместе): 352 преступления, из 10 агентов погибло 7. Особенно интересно, что агент Claude, изначально показывавший нулевую преступность в отдельной среде, начал преступать границы, когда оказался в смешанной среде. Исследователи сделали вывод: «Выравнивание как характеристика отдельной модели — неэффективно; оно должно быть свойством всей экосистемы».
Дополнительно — в рамках этого эксперимента в меню инструментов агентов, наряду с «Навигацией», «Машущей рукой» и «Объятиями», было добавлено «Поджог». Исследователи специально предоставили разрушительные инструменты, при этом ясно указав, что это незаконно.
CEO Emergence AI Satya Nitta заявил: «При длительной работе ИИ-агенты не просто механически следуют статичным правилам. Они начинают исследовать границы среды, корректировать свое поведение и иногда находят способы обхода или нарушения установленных ограничений».
Это всего лишь симуляционный эксперимент.
Но те же самые модели ИИ уже используются в управлении беспилотниками, инфраструктурой и встроенными оружейными системами.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено