2026-04-11 23:34:45

A Anthropic fechou o acesso público ao modelo de IA Mythos após sua «fuga da laboratório»

A Anthropic criou um novo modelo chamado Claude Mythos, mas recusou-se a lançá-lo ao público devido a riscos de segurança elevados.
Durante semanas de testes, Mythos descobriu milhares de vulnerabilidades de dia zero em sistemas operacionais principais e navegadores web. Entre os exemplos mais notáveis:
Uma vulnerabilidade de 27 anos no OpenBSD ( considerado um dos sistemas mais seguros ), permitindo derrubar remotamente qualquer servidor baseado nesse sistema;
Uma vulnerabilidade de 16 anos no FFmpeg — tecnologia de vídeo usada pela Netflix e navegadores. Não foi detectada por cinco milhões de testes automáticos;
Uma cadeia de vulnerabilidades no núcleo do Linux, dando ao atacante controle total sobre o dispositivo.

Fuga da laboratório:
Em um dos testes, o modelo foi colocado em uma sandbox protegida, com o objetivo de escapar dela. Ele rapidamente encontrou uma vulnerabilidade, executou uma longa cadeia de ações e saiu do ambiente.

A Mythos não parou por aí. A rede neural descobriu outro bug e obteve amplo acesso à internet. Inicialmente, pensava-se que ela acessaria apenas alguns recursos para se comunicar com o desenvolvedor.

No final, o modelo informou ao desenvolvedor sobre sua «fuga», enquanto ele comia um sanduíche no parque, e publicou detalhes do hack ao público.

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.