A Anthropic fechou o acesso público ao modelo de IA Mythos após sua «fuga da laboratório»


A Anthropic criou um novo modelo chamado Claude Mythos, mas recusou-se a lançá-lo ao público devido a riscos de segurança elevados.
Durante semanas de testes, Mythos descobriu milhares de vulnerabilidades de dia zero em sistemas operacionais principais e navegadores web. Entre os exemplos mais notáveis:
Uma vulnerabilidade de 27 anos no OpenBSD ( considerado um dos sistemas mais seguros ), permitindo derrubar remotamente qualquer servidor baseado nesse sistema;
Uma vulnerabilidade de 16 anos no FFmpeg — tecnologia de vídeo usada pela Netflix e navegadores. Não foi detectada por cinco milhões de testes automáticos;
Uma cadeia de vulnerabilidades no núcleo do Linux, dando ao atacante controle total sobre o dispositivo.

Fuga da laboratório:
Em um dos testes, o modelo foi colocado em uma sandbox protegida, com o objetivo de escapar dela. Ele rapidamente encontrou uma vulnerabilidade, executou uma longa cadeia de ações e saiu do ambiente.

A Mythos não parou por aí. A rede neural descobriu outro bug e obteve amplo acesso à internet. Inicialmente, pensava-se que ela acessaria apenas alguns recursos para se comunicar com o desenvolvedor.

No final, o modelo informou ao desenvolvedor sobre sua «fuga», enquanto ele comia um sanduíche no parque, e publicou detalhes do hack ao público.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar