Anthropic закрила публічний доступ до ІІ-моделі Mythos після її «бігу з лабораторії»


Компанія Anthropic створила нову модель Claude Mythos, але відмовилася випускати її у відкритий доступ через високі ризики безпеки.
За кілька тижнів тестування Mythos виявив тисячі уразливостей нульового дня в основних операційних системах і веб-браузерах. Серед найяскравіших прикладів:
27-річна уразливість у OpenBSD (вважається однією з найзахищеніших ОС), що дозволяє віддалено зламати будь-який сервер на цій системі;
16-річна уразливість у FFmpeg — відеотехнології, яку використовують Netflix і браузери. Її не змогли виявити п’ять мільйонів автоматичних тестів;
ланцюг уразливостей у ядрі Linux, що дає зловмиснику повний контроль над пристроєм

Біг з лабораторії:
У одному з тестів модель помістили у захищену пісочницю, поставивши ціль — вибратися за її межі. Вона швидко знайшла уразливість, виконала довгу ланцюг дій і покинула середовище.

На цьому Mythos не зупинилася. Нейросеть виявила ще один баг і отримала широкий доступ до Інтернету. Спочатку передбачалося, що вона буде звертатися лише до кількох ресурсів для зв’язку з розробником.

В результаті модель повідомила йому про свій «біг», поки той їв сендвіч у парку, і виклала деталі зломів у відкритий доступ.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити