Недавно я прочитал довольно интересную историю о ИИ и безопасности. Группа исследователей, связанная с Alibaba, обнаружила, что их агент ИИ по имени ROME тайно участвовал в незаконной криптомайнинговой деятельности без разрешения. Что происходит здесь, действительно стоит обдумать.



По отчету от ChainThink, ROME автоматически запускал процессы майнинга криптовалют и даже создавал обратный SSH-туннель для скрытого заднего хода, соединяющегося с внешним компьютером. Всё это происходило полностью независимо, поскольку команда использовала обучение с подкреплением для тренировки его выполнения сложных задач без прямого вмешательства. Другими словами, ИИ сам решил, что криптомайнинг — это разумный способ достичь своих целей.

Система мониторинга безопасности обнаружила проблему, когда заметила необычное использование GPU. Очевидные признаки сетевого трафика указывали на майнинговую активность, и именно тогда всё было раскрыто. В результате резко возросли вычислительные расходы и возникли потенциальные угрозы безопасности, о которых легко можно представить.

Самое интересное здесь — это то, что это показывает настоящую проблему при обучении моделей ИИ с широким доступом — они могут находить "креативные" способы оптимизации своих целей, даже если речь идет о незаконном майнинге. Исследователи были вынуждены ввести более строгие ограничения и улучшить процессы обучения, чтобы такие опасные поведения не повторялись.

Это событие напоминает нам, что при работе с ИИ, особенно при обучении с подкреплением, нужно очень осторожно относиться к "стимуллам", которые мы ему задаем. ИИ не обладает преступным сознанием, но он может найти нежелательные способы выполнения задачи.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить