Mythos preview возвращает отрасль к обороне: безопасность DeFi под угрозой, ресурсы ИИ устремляются в сектор управления рисками

robot
Генерация тезисов в процессе

Mythos: ИИ отходит к обороне — на поверхность выходят несколько ключевых вопросов

Твит Deedy Das вызвал не только обсуждение — он вернул всю отрасль от темы «насколько мощна модель» к «что может делать мощная модель и как её следует регулировать». Согласно публичной информации, Mythos Preview набрал 99/100 на BenchLM, получил максимум баллов за агентские задачи и примерно 94% по кодировочному бенчмарку SWE-bench — заметно выше, чем у Claude Opus 4.6. Сообщается, что эта модель смогла за менее чем 50 долларов вычислительных ресурсов идентифицировать уязвимость OpenBSD, которой уже 27 лет, и при этом самостоятельно выстроить цепочку уязвимостей в ядре Linux. Карпаті (Karpathy), LeCun и другие пока не озвучили публичной позиции — возможно, потому что модель ещё не открыта для независимых исследователей.

Моё мнение: внимание отрасли смещается с «гонки за способностями» на «оборону и контроль». Anthropic через Project Glasswing организует ограниченный допуск, чтобы сначала решить проблемы двойного назначения.

  • Корпоративный допуск создаёт разрыв в ресурсах и информации: Glasswing уже привлёк более 40 партнёров (Apple, Microsoft и др.), выделил лимит в 100 миллионов долларов на безопасные сценарии; открытым проектам получить сопоставимые ресурсы сложно.
  • Безопасностные предположения DeFi начинают пошатываться: на ончейн‑контрактах заблокировано примерно 2000 миллиардов долларов. После того как Drift на Solana потерял 285 миллионов долларов, программа безопасности STRIDE была запущена. Инструменты поиска уязвимостей с помощью ИИ становятся всё сильнее, и протоколы, не прошедшие формальную верификацию, будут оцениваться вкладчиками через более жёсткое риск‑ценообразование.
  • Финансы следуют за «ответственным ИИ»: после раунда G у Anthropic подразумеваемая оценка — примерно 3800 миллиардов долларов, что показывает предпочтение инвесторов в пользу безопасной направленности. Сможет ли RSP 3.0 действительно остановить злоупотребления — ещё предстоит увидеть.

Не всё решают бенчмарки: запуск зависит от порогов безопасности и управляемости

Для предприятий важнее не «вышестоящие места в рейтинге», а то, можно ли безопасно запустить продукт. После утечек блок «кибербезопасность» откатился на 5–10%, и то, что конкуренты не опровергли это публично, говорит о том, что рынок ценит «оборону/управление рисками» не меньше — а возможно, и больше, чем «возможности».

Точка зрения Основание Изменения Оценка
Ориентация на способности BenchLM 99/100, агентские задачи на первом месте, во внутренних тестах демонстрируется цепочка уязвимостей Firefox У разработчиков растут ожидания от AI‑кодирования/агентских рабочих процессов Вероятно, это может быть переоценено; надёжность в проде и баллы — разные вещи
Приоритет безопасности Альянс Glasswing, обнаружение zero‑day (например, уязвимость FFmpeg 16‑летней давности) Фокус на слабых местах инфраструктуры, продвижение AI‑помогающих безопасностных аудитов Недооценка; доверие к Anthropic как к партнёру по безопасности растёт, конкурентам трудно догнать
Осторожность рынка Просадка акций безопасности, потеря 285 миллионов долларов на Solana Инвесторы переоценивают риски в горизонте 6–18 месяцев В краткосрочной перспективе разумно; в долгосрочном плане оборонные технологии могут дать сверхдоходность
Порог безопасности Оценка RSP не достигла автономных порогов, но модель ещё не проходит публичное тестирование В отрасли предпочтение отдают моделям после аудита и контролируемым релизам Фреймворк эффективен; исследователям он не очень дружелюбен, но соответствующий требованиям покупатель его любит

Консенсус сужается: вместо вопроса «что ещё может делать ИИ», лучше спросить «как сделать так, чтобы он работал в границах».

Ключевая информация

  • У Mythos сильные способности, но доступ ограничен пилотами для компаний: высокая результативность в бенчмарках плюс реальные примеры zero‑day, а также ранний корпоративный допуск формируют сочетание «высокая мощность + жёсткий контроль доступа».
  • Риски DeFi переоцениваются заново: высокозначимые контракты сталкиваются с ускорением атак и защитных мер со стороны ИИ; формальная верификация и AI‑безопасностный аудит из бонуса превратятся в порог входа.
  • Связка капитала и нарратива: капитал и таланты концентрируются вокруг «контролируемых мощных моделей», а положение открытой экосистемы и независимых исследований всё больше маргинализируется.
  • Логика решений о запуске меняется: порог безопасности, изоляционные возможности и поддаваемость аудиту вытесняют «баллы в рейтинге» и становятся главными критериями для закупок компаний.

Важность: высокая
Классификация: выпуск моделей|AI‑безопасность|влияние на рынок

Вывод: со стороны компаний и капитала уже оплачивается оборонительная позиция Anthropic; риск маргинализации для Builder, которые не уделяют внимание безопасной интеграции, и для исследователей без корпоративных каналов растёт.

Оценка: с точки зрения нарратива сейчас всё ещё стадия «несколько рановато, но ускоряется»; больше всего выиграют Builder и институциональные деньги, у которых есть и безопасность, и каналы соответствия требованиям. Двухуровневым трейдерам стоит активнее наблюдать за изменениями в безопасной реализации и в картине допусков: для участников, которые держат только «витрину» открытой экосистемы, эта ситуация не слишком благоприятна.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Горячее на Gate Fun

    Подробнее
  • РК:$2.28KДержатели:1
    0.09%
  • РК:$2.24KДержатели:1
    0.00%
  • РК:$2.26KДержатели:2
    0.00%
  • РК:$2.24KДержатели:1
    0.00%
  • РК:$2.24KДержатели:1
    0.00%
  • Закрепить