Исследователь Anthropic демонстрирует: массовый поиск 500 нулевых дней с помощью LLM

robot
Генерация тезисов в процессе

Заголовок

Исследователь Anthropic на [un]prompted 2026 демонстрирует: LLM массово находит 500 нулевых уязвимостей

Резюме

Рохан Паул поделился видео выступления Николаса Карлини на [un]prompted 2026 под названием “Black-hat LLMs”. Карлини является исследователем в области безопасности AI в Anthropic, и он продемонстрировал, как злоумышленники могут с помощью больших языковых моделей выявлять и использовать уязвимости программного обеспечения. Ключевая цифра: 500 уязвимостей нулевого дня были автоматически сгенерированы. Более того: с увеличением возможностей LLM в исследовании уязвимостей модель угроз переходит от “как атаковать модели AI” к “что произойдет, если AI начнет атаковать другие системы”.

Анализ

Это не бумажная теория, а воспроизводимое эмпирическое исследование. Карлини зафиксировал реальные дефекты, которые LLM выявляет, в то время как традиционные методы, такие как нечеткое тестирование и статический анализ, их пропускают, включая проблемы обхода аутентификации. Он неоднократно подчеркивает эффективность в своем блоге:

  • LLM не обязательно создают совершенно новые типы атак, но значительно снижают стоимость и порог существующих атак
  • Типичные выгоды включают: массовое создание фишинговых атак, автоматизированную разведку целей, скриптовое связывание цепочек эксплуатации
  • Эти этапы, которые ранее требовали средств или высокой квалификации, стали “популярными” благодаря моделям и могут быть масштабированы параллельно

Обратная связь от сообщества (дискуссии на конференции и потоки Hacker News) показывает, что отрасль всерьез воспринимает это изменение. Есть разумное противоположное мнение: AI-поддерживаемая разработка уязвимостей может больше способствовать защите, поскольку компании могут систематически внедрять ее в CI/CD и базовые активы, охватывая более широкий спектр и обнаруживая уязвимости раньше. Но Карлини четко заявил, что результаты все еще неопределенны — никто не может сделать окончательный вывод, кто получит больше выгоды: защитники или атакующие.

Беспокоящий вопрос — временной аспект: что произойдет, если в течение следующих 6-12 месяцев возможности продолжат расти? Работа Карлини показывает, что мы еще далеки от “потолка”.

Обзор воздействия на атаку и защиту

Аспект Что получают атакующие Что получают защитники
Стоимость и скорость Снижение затрат и ускорение, массовая фишинговая/разведывательная/эксплуатационная деятельность Полное сканирование кода и конфигураций, более раннее обнаружение дефектов
Охват Долгосрочные цели и редкие технологические стеки включаются в список атак Более частый охват всех активов и цепочек поставок
Профессиональный порог Снижение требований к навыкам, пределы возможностей скриптующих «малышей» повышаются Платформенное внедрение, сочетание инфраструктурных и процессуальных преимуществ
Неопределенность Эффективность зависит от данных/выравнивания/защитных помех Необходимость решения проблем ложных срабатываний, соблюдения норм и затрат на взаимодействие человека и машины

Заключение:

  • LLM масштабирует и формализует “известные рабочие атаки”, а не создает новые парадигмы из воздуха
  • В краткосрочной перспективе игра “атака-защита” зависит от того, кто быстрее интегрирует модели в производственные потоки (данные, вычислительные мощности, оценка и обратная связь)

Оценка воздействия

  • Важность: Высокая
  • Область: Безопасность AI, Исследования AI, Техническая информация

Оценка: Мы находимся на “ранней, но ускоряющейся” точке перелома. Наибольшее преимущество имеют команды защиты, обладающие инженерными и процессными способностями, безопасные компании, крупные предприятия, а также фонды, способные выделять средства и ресурсы для инкубации инструментов. Индивиды, работающие в красной команде, получат выгоду, но систематически внедряющие это люди первыми получат большую отдачу.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Горячее на Gate Fun

    Подробнее
  • РК:$2.27KДержатели:2
    0.00%
  • РК:$2.37KДержатели:2
    1.04%
  • РК:$2.24KДержатели:1
    0.00%
  • РК:$2.24KДержатели:1
    0.00%
  • РК:$2.25KДержатели:1
    0.00%
  • Закрепить