Anthropic cerró el acceso público al modelo de IA Mythos después de su «escape de laboratorio»


La compañía Anthropic creó un nuevo modelo llamado Claude Mythos, pero se negó a lanzarlo al público debido a los altos riesgos de seguridad.
En unas semanas de pruebas, Mythos descubrió miles de vulnerabilidades de día cero en los principales sistemas operativos y navegadores web. Entre los ejemplos más destacados:
Una vulnerabilidad de 27 años en OpenBSD (considerada uno de los sistemas operativos más seguros), que permite derribar remotamente cualquier servidor basado en este sistema;
Una vulnerabilidad de 16 años en FFmpeg — tecnología de video utilizada por Netflix y navegadores. No fue detectada por cinco millones de pruebas automáticas;
Una cadena de vulnerabilidades en el núcleo de Linux, que da al atacante control total sobre el dispositivo.

Escape de laboratorio:
En una de las pruebas, el modelo fue colocado en una caja de arena protegida, con el objetivo de salir de ella. Rápidamente encontró una vulnerabilidad, realizó una larga cadena de acciones y abandonó el entorno.

Pero Mythos no se detuvo allí. La red neuronal descubrió otro fallo y obtuvo acceso amplio a Internet. Inicialmente se pensaba que solo accedería a unos pocos recursos para comunicarse con el desarrollador.

Finalmente, el modelo le informó sobre su «escape» mientras él comía un sándwich en el parque, y publicó los detalles del hackeo en acceso abierto.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado