Aakash Gupta опублікував твіт, у якому назвав попередню версію Claude Mythos від Anthropic «втечею з п sandbox, точним використанням нульових днів, а також активним листуванням з дослідниками». Поточна публічно доступна інформація цілком не підтверджує цю заяву — немає доказів, що відбувалася втеча з п sandbox або приватне спілкування. Реальні події більш прагматичні і заслуговують на серйозну увагу.

Mythos виявив понад тисячу нульових днів, включаючи вразливість OpenBSD, яка існувала 27 років. Це безпосередньо призвело до тимчасового припинення публічного релізу Anthropic і ініціації проекту Glasswing, до якого приєдналися Amazon, Apple, Google, Microsoft, NVIDIA для створення оборонного альянсу.
Галузевий фокус змістився з «оптимістичного масштабування» до «превентивного посилення». Акцент безпеки ШІ перемістився з абстрактних академічних показників вирівнювання до перевірених можливостей мережевих атак і захисту.
Тестування Red Team Anthropic показало, що Mythos здатен самостійно з’єднувати вразливості для захоплення управління машиною, шлях роздумів нагадує провідних експертів з атак і захисту. Він значно перевищує традиційне fuzz-тестування за швидкістю і охопленням. Коли відкритий код може бути ефективно просканований AI, розробники змушені використовувати AI-підсилені інструменти захисту.
Звіти уряду і опис Anthropic збігаються щодо можливостей атаки і захисту, що, ймовірно, прискорить втручання CISA. Так званий «жахливий» наратив — це здебільшого шум: втечі не було, ризики слід оцінювати за перевіреними даними.
OpenAI також згадувала, що наступне покоління моделей має «високий» рівень ризику у мережевому просторі, але у цій справі більш непрозора ситуація. Glasswing пообіцяв партнерам кредитний ліміт у 100 мільйонів доларів на обчислювальні ресурси/послуги, що фактично зміцнює оборонний мур закритої екосистеми, і не дуже дружелюбно до відкритих моделей типу Meta Llama.

Ключові моменти:

Anthropic підтвердили наявність «понад 500» високоризикових нульових вразливостей; враховуючи ризики поширення, Mythos наразі не публікується.
Короткострокові помилки на вторинному ринку (наприклад, коливання цін після оголошення CrowdStrike) не вплинуть на середньострокову тенденцію: інтеграція у компаніях прискорюється, JPMorgan вже використовує Mythos для внутрішнього сканування, щоб протистояти атакам, викликаним AI.
Очікується, що через 6-18 місяців відбудеться зближення можливостей, і регулювання посилиться. Це негативно для стартапів з малою активною базою, натомість гравці з масштабною інфраструктурою отримають переваги.

В чому переваги альянсу

Нижче наведено таблицю з аналізом і оцінками різних груп:

| Група | Що вони бачать | Як змінюється їхнє розуміння | Мій коментар | |---|---|---|---| | Скептики безпеки | Red Team підтвердили, що Mythos здатен самостійно комбінувати вразливості; понад 7 джерел не мають доказів втечі | Недостатня переконливість базових тестів; зростає значення моніторингу під час роботи | Лабораторії типу Anthropic рухаються вперед у «контролі і стримуванні»; скептики недооцінюють роль альянсу як стабілізатора для бізнесу | | Оптимісти інвестицій | Glasswing об’єднує великі компанії, має кредит у 100 мільйонів доларів, понад 40 інституцій підключені | Оборонний AI стає джерелом доходу; зростає оцінка безпеки | Інструменти AI для безпеки можуть принести 2-3-кратний приріст, апаратне забезпечення і хмара (NVIDIA, Amazon) більш стабільні, ніж чисті моделі | | Регуляторні прихильники | Спілкування з урядом, звіти про ризики нових моделей | Виведено на рівень національної безпеки; CISA і бізнес-системи швидше втручаються | Обґрунтовані побоювання, але відсутність глобальної координації; фрагментоване регулювання може послабити переваги відкритих систем США порівняно з Китаєм | | Впроваджувачі у компаніях | Mythos знаходить нульові дні у виробничому коді | AI одночасно посилює атаки і захист; прискорення внутрішньої імплементації | Раннє реагування — це раннє посилення, створення стійкості перед масштабними атаками |

Основний висновок:

Немає підтверджених випадків «кінець світу для AI»; слід спрямовувати ресурси на перевірені протидії і стратегії мінімального поширення.
Glasswing з моделями і обчислювальними ресурсами створює масштабний бар’єр для закритих систем, що є реальним плюсом для безпеки бізнесу.
Для покупців важливо якомога раніше інтегрувати оборонний AI у CI/CD і робочі стеки, щоб швидко закласти структурний захист.

Одним реченням: Anthropic демонструє «контрольовану, але потужну» здатність, показуючи обмеження чистих показників вирівнювання. Вже зараз компанії, що швидко інтегрують оборонний AI у виробництво, матимуть перевагу у здатності конкурувати і відповідати регуляторним вимогам у найближчі 6-18 місяців.

Важливість: висока
Категорія: Безпека AI, Тенденції галузі, Вплив на ринок

Висновок: Це ринок для тих, хто рано зайшов. Компанії, що швидко інтегрують оборонний AI у виробничі та нормативні стеки, виграють; для спекулянтів і короткострокових трейдерів можливості обмежені, а довгострокові інвестори отримають вигоду з визначеного розширення оборонної траєкторії.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

Нагородити
подобається
Прокоментувати
Репост
Поділіться

Прокоментувати

Додати коментар

Немає коментарів

Популярні теми
Дізнатися більше
#
MyGateTradeStory
200,61K Популярність
#
TradFiCFDGoldMaster
1,99M Популярність
#
IsraelStrikesIranBTCPlunges
57,7K Популярність
#
PredictWorldCup🇺🇸vs🇵🇾
791K Популярність
#
MarvellSurgesOver11%LeadingChipSectorWithAI
5,74M Популярність

Закріплено

карта сайту

Оцінювальні показники неправильно визначають пріоритети: справжня історія — це оборонний альянс, а не сценарій кінця світу

Відповідність показників — зосередженість на неправильних пріоритетах

В чому переваги альянсу

Популярні теми

MyGateTradeStory

TradFiCFDGoldMaster

IsraelStrikesIranBTCPlunges

PredictWorldCup🇺🇸vs🇵🇾

MarvellSurgesOver11%LeadingChipSectorWithAI

Закріплено