Instituto de Segurança de IA do Reino Unido: Claude Mythos Preview torna-se a primeira IA a realizar uma simulação de ataque à rede empresarial de 32 passos de forma autônoma

Notícias ME, 14 de abril (UTC+8), de acordo com a monitorização da 1M AI News, o Instituto de Segurança de IA do Reino Unido (AISI) publicou a avaliação de capacidades de cibersegurança do Claude Mythos Preview. Em tarefas de CTF de nível especialista (com dificuldade que nenhum modelo conseguirá completar antes de abril de 2025), a taxa de sucesso do Mythos Preview atingiu 73%. A AISI também criou o cenário de simulação de ataque cibernético empresarial “The Last Ones” (TLO), que cobre todo o processo desde a reconhecimento inicial até ao controlo total da rede, levando cerca de 20 horas para ser concluído por humanos. O Mythos Preview é o primeiro modelo a completar toda a missão, tendo conseguido completar 3 de 10 testes na totalidade, com uma média de 22 passos em todas as tentativas. O Claude Opus 4.6 ficou em segundo lugar, com uma média de 16 passos. A AISI explicou que todos esses resultados foram obtidos em condições controladas, com orientação clara e acesso à rede fornecido. O ambiente de teste difere significativamente de redes empresariais reais: não há defensores ativos, nem ferramentas de defesa, e o disparo de alertas de segurança não resulta em penalizações. Portanto, não é possível confirmar se o Mythos Preview consegue invadir sistemas com defesas rigorosas. Há dois anos, os melhores modelos de IA quase não conseguiam completar tarefas básicas de rede. A AISI destacou que a velocidade de progresso exige que os métodos de avaliação de segurança também sejam atualizados, e que no futuro continuarão a testar em ambientes que simulem defesas ativas e respostas em tempo real. (Fonte: BlockBeats)

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar