Оцінювальні показники неправильно визначають пріоритети: справжня історія — це оборонний альянс, а не сценарій кінця світу

robot
Генерація анотацій у процесі

Відповідність показників — зосередженість на неправильних пріоритетах

Aakash Gupta опублікував твіт, у якому назвав попередню версію Claude Mythos від Anthropic «втечею з п sandbox, точним використанням нульових днів, а також активним листуванням з дослідниками». Поточна публічно доступна інформація цілком не підтверджує цю заяву — немає доказів, що відбувалася втеча з п sandbox або приватне спілкування. Реальні події більш прагматичні і заслуговують на серйозну увагу.

  • Mythos виявив понад тисячу нульових днів, включаючи вразливість OpenBSD, яка існувала 27 років. Це безпосередньо призвело до тимчасового припинення публічного релізу Anthropic і ініціації проекту Glasswing, до якого приєдналися Amazon, Apple, Google, Microsoft, NVIDIA для створення оборонного альянсу.
  • Галузевий фокус змістився з «оптимістичного масштабування» до «превентивного посилення». Акцент безпеки ШІ перемістився з абстрактних академічних показників вирівнювання до перевірених можливостей мережевих атак і захисту.
  • Тестування Red Team Anthropic показало, що Mythos здатен самостійно з’єднувати вразливості для захоплення управління машиною, шлях роздумів нагадує провідних експертів з атак і захисту. Він значно перевищує традиційне fuzz-тестування за швидкістю і охопленням. Коли відкритий код може бути ефективно просканований AI, розробники змушені використовувати AI-підсилені інструменти захисту.
  • Звіти уряду і опис Anthropic збігаються щодо можливостей атаки і захисту, що, ймовірно, прискорить втручання CISA. Так званий «жахливий» наратив — це здебільшого шум: втечі не було, ризики слід оцінювати за перевіреними даними.
  • OpenAI також згадувала, що наступне покоління моделей має «високий» рівень ризику у мережевому просторі, але у цій справі більш непрозора ситуація. Glasswing пообіцяв партнерам кредитний ліміт у 100 мільйонів доларів на обчислювальні ресурси/послуги, що фактично зміцнює оборонний мур закритої екосистеми, і не дуже дружелюбно до відкритих моделей типу Meta Llama.

Ключові моменти:

  • Anthropic підтвердили наявність «понад 500» високоризикових нульових вразливостей; враховуючи ризики поширення, Mythos наразі не публікується.
  • Короткострокові помилки на вторинному ринку (наприклад, коливання цін після оголошення CrowdStrike) не вплинуть на середньострокову тенденцію: інтеграція у компаніях прискорюється, JPMorgan вже використовує Mythos для внутрішнього сканування, щоб протистояти атакам, викликаним AI.
  • Очікується, що через 6-18 місяців відбудеться зближення можливостей, і регулювання посилиться. Це негативно для стартапів з малою активною базою, натомість гравці з масштабною інфраструктурою отримають переваги.

В чому переваги альянсу

Нижче наведено таблицю з аналізом і оцінками різних груп:

Група Що вони бачать Як змінюється їхнє розуміння Мій коментар
Скептики безпеки Red Team підтвердили, що Mythos здатен самостійно комбінувати вразливості; понад 7 джерел не мають доказів втечі Недостатня переконливість базових тестів; зростає значення моніторингу під час роботи Лабораторії типу Anthropic рухаються вперед у «контролі і стримуванні»; скептики недооцінюють роль альянсу як стабілізатора для бізнесу
Оптимісти інвестицій Glasswing об’єднує великі компанії, має кредит у 100 мільйонів доларів, понад 40 інституцій підключені Оборонний AI стає джерелом доходу; зростає оцінка безпеки Інструменти AI для безпеки можуть принести 2-3-кратний приріст, апаратне забезпечення і хмара (NVIDIA, Amazon) більш стабільні, ніж чисті моделі
Регуляторні прихильники Спілкування з урядом, звіти про ризики нових моделей Виведено на рівень національної безпеки; CISA і бізнес-системи швидше втручаються Обґрунтовані побоювання, але відсутність глобальної координації; фрагментоване регулювання може послабити переваги відкритих систем США порівняно з Китаєм
Впроваджувачі у компаніях Mythos знаходить нульові дні у виробничому коді AI одночасно посилює атаки і захист; прискорення внутрішньої імплементації Раннє реагування — це раннє посилення, створення стійкості перед масштабними атаками

Основний висновок:

  • Немає підтверджених випадків «кінець світу для AI»; слід спрямовувати ресурси на перевірені протидії і стратегії мінімального поширення.
  • Glasswing з моделями і обчислювальними ресурсами створює масштабний бар’єр для закритих систем, що є реальним плюсом для безпеки бізнесу.
  • Для покупців важливо якомога раніше інтегрувати оборонний AI у CI/CD і робочі стеки, щоб швидко закласти структурний захист.

Одним реченням: Anthropic демонструє «контрольовану, але потужну» здатність, показуючи обмеження чистих показників вирівнювання. Вже зараз компанії, що швидко інтегрують оборонний AI у виробництво, матимуть перевагу у здатності конкурувати і відповідати регуляторним вимогам у найближчі 6-18 місяців.

Важливість: висока
Категорія: Безпека AI, Тенденції галузі, Вплив на ринок

Висновок: Це ринок для тих, хто рано зайшов. Компанії, що швидко інтегрують оборонний AI у виробничі та нормативні стеки, виграють; для спекулянтів і короткострокових трейдерів можливості обмежені, а довгострокові інвестори отримають вигоду з визначеного розширення оборонної траєкторії.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити