Anthropic створила найпотужнішу в історії модель ШІ, але не наважується її оприлюднити……

robot
Генерація анотацій у процесі

Оригінал | Odaily Зоряний вісник ( @OdailyChina )

Автор|Азумо ( @azuma_eth )

8 квітня компанія Anthropic, що стоїть за Claude, офіційно оголосила про запуск нової ініціативи під назвою «Крилa зі скла» (Project Glasswing). Цей проєкт буде реалізований спільно з кількома провідними компаніями, зокрема Amazon, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, Linux Foundation, Microsoft, Nvidia та Palo Alto Networks тощо.

Anthropic заявляє, що це невідкладний крок, спрямований на захист найкритичнішого програмного забезпечення у світі, і всі сторони спільно використовуватимуть попередню версію Mythos Preview, щоб виявляти та виправляти потенційні недоліки в системах, від яких нині залежить існування світу.

Під «Mythos» мається на увазі наступне покоління AI-моделі, над якою працює Anthropic. Це перша в історії людства модель із загальною кількістю параметрів на рівні понад один трильйон (на відміну від цього, нинішні провідні моделі на ринку мають кількість параметрів здебільшого на рівні від сотень мільярдів до одного трильйона), а витрати на навчання досягли вражаючих 10 мільярдів доларів США. Порівняно з Opus 4.6 — нині найпотужнішою моделлю Claude — Mythos значно покращує результати в тестах з програмування, академічного міркування та кібербезпеки.

Чутки про Mythos поширювалися ще минулого тижня, а загальна тривога ринку тоді зводилася до такого: — чи вплине Mythos, націлений на кібербезпеку, на поточний баланс у сфері безпеки та протидії атакам? Якщо його буде використано зі зловмисними намірами, чи спричинить це масштабніші інциденти? Odaily тоді також повідомляв про цю тему, і навіть обговорював із фахівцями з безпеки з індустрії, зокрема з Мо Янь — засновником «повільного туману», потенційний вплив на безпеку й протидію атакам у криптовалютній індустрії (див. «Інтерв’ю Odaily із Мо Янем: витік нової AI-моделі Anthropic рівня “ядерної бомби” — як це вплине на кібербезпеку крипто?»), але тоді з боку Anthropic не було публічного визнання існування Mythos, тож відповідної інформації все ще бракувало.

8 квітня, після оголошення плану «Крилa зі скла», Anthropic розкрив також більше деталей щодо Mythos. Згідно з оприлюдненими Anthropic результатами реальних тестових кейсів, компанія не перебільшувала можливості Mythos — і через це навіть не ризикнула прямо випустити саму модель, щоб не дати хакерським угрупованням використати її зі зловмисними намірами. Натомість компанія планує спочатку через програму «Крила зі скла» надати можливість випробувати та перевірити її провідним компаніям, щоб завчасно усунути потенційні вразливості.

Mythos показує м’язи: за кілька тижнів — виявлено тисячі «нулів-денних» вразливостей

Розповідаючи про потужність Mythos, Anthropic прямо зазначає, що поява цієї моделі означає вже настання суворого факту: — можливості AI-моделей у програмуванні досягли дуже високого рівня, і виявлення та використання вразливостей у програмному забезпеченні майже дозволяє їм випереджати всіх, окрім найкваліфікованіших людей.

Згідно з тим, що розкрила Anthropic, лише за кілька тижнів Anthropic за допомогою Mythos виявила тисячі нуль-денних вразливостей (тобто дефектів, які раніше не виявляли навіть самі розробники програмного забезпечення). Багато з них належать до критичних/високоризикових вразливостей, проблеми охоплювали всі основні операційні системи та популярні браузери, а також зачіпали низку інших критично важливих програм.

Anthropic навела кілька доволі показових прикладів:

  • Mythos виявила в OpenBSD вразливість, яка існувала 27 років. Ця система довго славилася як «надзвичайно безпечна» та широко використовувалася для ключової інфраструктури, зокрема фаєрволів. Водночас ця вразливість дозволяла атакувальникам дистанційно безпосередньо спричиняти крах системи;
  • У бібліотеці для обробки відео FFmpeg, якою користується безліч програм, Mythos знайшла вразливість, що існувала 16 років. Проблемний фрагмент коду під час автоматизованого тестування тригерився понад 5 млн разів, але її так і не виявили;
  • Mythos також здатна автоматично «склеювати» кілька вразливостей у ядрі Linux, підвищуючи права доступу від звичайного користувача до повного контролю сервера.

Ще тривожніше те, що Anthropic зазначає: більшість цих вразливостей Mythos «самостійно виявляла й конструювала шляхи експлуатації» майже без будь-якого втручання людей. Це може означати, що AI вже почав отримувати автоматизовані можливості атак і оборони, подібні до рівня топових хакерських команд.

У бенчмарках оцінювання Mythos також демонструє еволюцію «з розривом» у порівнянні з Opus 4.6. Наприклад, у тестах відтворення вразливостей у мережевій безпеці Mythos досяг 83,1%, тоді як Opus 4.6 — 66,6%; у кількох тестах із програмування та міркування Mythos також показує суттєве лідерство.

Можливо, саме тому, що можливості Mythos надто потужні, Anthropic не обрала варіант прямого відкриття моделі. Натомість компанія спочатку запустила план «Крила зі скла», щоб увесь інтернет завчасно «підсилив» захист.

У межах цього плану Anthropic надаватиме учасникам попередню версію Mythos Preview заздалегідь для виявлення та виправлення вразливостей або слабких місць у базових системах — з акцентом на завдання на кшталт виявлення локальних вразливостей, black-box тестування двійкових програм, посилення безпеки кінцевих пристроїв і тестування систем на проникнення.

Anthropic також пообіцяла, що надасть учасникам сумарно 100 мільйонів доларів США в лімітах на використання моделей, щоб підтримати використання на всьому етапі дослідницького прев’ю. Після цього версія Mythos Preview відкриватиметься учасникам за ціною 25 доларів США / 125 доларів США за кожен мільйон вхідних / вихідних tokens відповідно (учасники також можуть отримати доступ до моделі через Claude API, Amazon Bedrock, Google Cloud Vertex AI та Microsoft Foundry). Окрім лімітів на використання моделей, Anthropic також через Linux Foundation передасть 2,5 мільйона доларів США Alpha-Omega та OpenSSF, а також 1,5 мільйона доларів США Фонду Apache для підтримки розробників і супровідників open source у відповідь на постійно змінюване середовище кібербезпеки.

Anthropic планує поступово розширювати коло учасників «Крил зі скла» та продовжувати роботу протягом кількох місяців, а також максимально ділитися напрацюваннями, щоб інші організації могли застосувати цей досвід у власному захисті. Протягом 90 днів Anthropic опублікує звіт про проміжні результати, включно з уже виправленими вразливостями та тим, які заходи безпеки можна буде розкривати публічно.

Технології лише й далі зростатимуть, але й надто турбуватися теж не треба

AI незворотно змінює світ, до якого ми звикли, включно з сферою кібербезпеки, на яку звертає увагу ця стаття. Оскільки поріг виявлення та експлуатації вразливостей значно знизився, люди не можуть не хвилюватися: чи не стане AI лезом у руках зловмисників і чи не порушить він наявний баланс кібербезпеки? (PS: для користувачів криптовалют, яким потрібно розміщувати реальні гроші у гаманцевих системах або ончейн-протоколах, ця тривога буде особливо сильною.)

Відповідаючи на це питання, Anthropic вважає, що «у нас усе ще є підстави зберігати оптимізм». Небезпека AI полягає в тому, що він може заподіяти шкоду в руках недобросовісних осіб, але водночас AI має неперевершену цінність для виявлення та виправлення критичних недоліків у важливому програмному забезпеченні, а також для розробки нових, безпечніших програм.

Можна передбачити, що в найближчі роки можливості AI й надалі швидко еволюціонуватимуть. Проте коли з’являтимуться нові способи атак, тоді ж виникатимуть і нові механізми захисту. Оновлення технологій є неминучими, але це не означає, що ризики обов’язково вийдуть з-під контролю — за умови, що система оборони синхронно еволюціонуватиме, а навіть зможе за допомогою AI вибудувати ще надійніший «захисний рів» безпеки.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити