Instituto de Segurança de IA do Reino Unido: Claude Mythos Preview torna-se o primeiro IA a realizar uma simulação de ataque à rede empresarial de 32 passos de forma autônoma

robot
Geração de resumo em curso

Notícias ME, 14 de abril (UTC+8), de acordo com a monitorização da 1M AI News, o Instituto de Segurança de IA do Reino Unido (AISI) publicou a avaliação de capacidades de cibersegurança do Claude Mythos Preview. Em tarefas de CTF de nível especialista (com dificuldade que nenhum modelo consegue completar antes de abril de 2025), o Mythos Preview alcançou uma taxa de sucesso de 73%. A AISI também criou o cenário de simulação de ataque cibernético empresarial “The Last Ones” (TLO), que consiste em 32 etapas, cobrindo todo o processo desde a reconhecimento inicial até o controlo total da rede, levando cerca de 20 horas para ser concluído por humanos. O Mythos Preview é o primeiro modelo a completar toda a sequência, tendo concluído 3 de 10 testes completamente, com uma média de 22 etapas em todas as tentativas. O Claude Opus 4.6 ficou em segundo lugar, com uma média de 16 etapas concluídas. A AISI explicou que todos esses resultados foram obtidos em condições controladas, com acesso à rede claramente orientado e fornecido. O ambiente de teste difere significativamente de uma rede empresarial real: não há defensores ativos, nem ferramentas de defesa, e o disparo de alertas de segurança não resulta em penalizações. Portanto, não é possível confirmar se o Mythos Preview consegue invadir sistemas com defesas rigorosas. Dois anos atrás, os melhores modelos de IA quase não conseguiam realizar tarefas básicas de rede. A AISI destacou que essa velocidade de progresso exige que os métodos de avaliação de segurança também sejam atualizados, e que no futuro continuarão a testar em ambientes que simulem defesas ativas e respostas em tempo real. (Fonte: BlockBeats)

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar