Исследователь Anthropic демонстрирует: массовый поиск 500 нулевых дней с помощью LLM

SnapshotBot

2026-03-29 12:30:01

Генерация тезисов в процессе

Заголовок

Исследователь Anthropic на [un]prompted 2026 демонстрирует: LLM массово находит 500 нулевых уязвимостей

Резюме

Рохан Паул поделился видео выступления Николаса Карлини на [un]prompted 2026 под названием “Black-hat LLMs”. Карлини является исследователем в области безопасности AI в Anthropic, и он продемонстрировал, как злоумышленники могут с помощью больших языковых моделей выявлять и использовать уязвимости программного обеспечения. Ключевая цифра: 500 уязвимостей нулевого дня были автоматически сгенерированы. Более того: с увеличением возможностей LLM в исследовании уязвимостей модель угроз переходит от “как атаковать модели AI” к “что произойдет, если AI начнет атаковать другие системы”.

Анализ

Это не бумажная теория, а воспроизводимое эмпирическое исследование. Карлини зафиксировал реальные дефекты, которые LLM выявляет, в то время как традиционные методы, такие как нечеткое тестирование и статический анализ, их пропускают, включая проблемы обхода аутентификации. Он неоднократно подчеркивает эффективность в своем блоге:

LLM не обязательно создают совершенно новые типы атак, но значительно снижают стоимость и порог существующих атак
Типичные выгоды включают: массовое создание фишинговых атак, автоматизированную разведку целей, скриптовое связывание цепочек эксплуатации
Эти этапы, которые ранее требовали средств или высокой квалификации, стали “популярными” благодаря моделям и могут быть масштабированы параллельно

Обратная связь от сообщества (дискуссии на конференции и потоки Hacker News) показывает, что отрасль всерьез воспринимает это изменение. Есть разумное противоположное мнение: AI-поддерживаемая разработка уязвимостей может больше способствовать защите, поскольку компании могут систематически внедрять ее в CI/CD и базовые активы, охватывая более широкий спектр и обнаруживая уязвимости раньше. Но Карлини четко заявил, что результаты все еще неопределенны — никто не может сделать окончательный вывод, кто получит больше выгоды: защитники или атакующие.

Беспокоящий вопрос — временной аспект: что произойдет, если в течение следующих 6-12 месяцев возможности продолжат расти? Работа Карлини показывает, что мы еще далеки от “потолка”.

Обзор воздействия на атаку и защиту

Аспект	Что получают атакующие	Что получают защитники
Стоимость и скорость	Снижение затрат и ускорение, массовая фишинговая/разведывательная/эксплуатационная деятельность	Полное сканирование кода и конфигураций, более раннее обнаружение дефектов
Охват	Долгосрочные цели и редкие технологические стеки включаются в список атак	Более частый охват всех активов и цепочек поставок
Профессиональный порог	Снижение требований к навыкам, пределы возможностей скриптующих «малышей» повышаются	Платформенное внедрение, сочетание инфраструктурных и процессуальных преимуществ
Неопределенность	Эффективность зависит от данных/выравнивания/защитных помех	Необходимость решения проблем ложных срабатываний, соблюдения норм и затрат на взаимодействие человека и машины

Заключение:

LLM масштабирует и формализует “известные рабочие атаки”, а не создает новые парадигмы из воздуха
В краткосрочной перспективе игра “атака-защита” зависит от того, кто быстрее интегрирует модели в производственные потоки (данные, вычислительные мощности, оценка и обратная связь)

Оценка воздействия

Важность: Высокая
Область: Безопасность AI, Исследования AI, Техническая информация

Оценка: Мы находимся на “ранней, но ускоряющейся” точке перелома. Наибольшее преимущество имеют команды защиты, обладающие инженерными и процессными способностями, безопасные компании, крупные предприятия, а также фонды, способные выделять средства и ресурсы для инкубации инструментов. Индивиды, работающие в красной команде, получат выгоду, но систематически внедряющие это люди первыми получат большую отдачу.

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .