Instituto de Seguridad de IA del Reino Unido: Claude Mythos Preview se convierte en la primera IA en realizar una simulación de ataque a redes empresariales autónoma que atraviesa 32 pasos

ME News Noticias, 14 de abril (UTC+8), según la monitorización de 1M AI News, el Instituto de Seguridad de IA del Reino Unido (AISI) publicó la evaluación de capacidades de ciberseguridad de Claude Mythos Preview. En tareas de CTF a nivel experto (con dificultad que ningún modelo podrá completar antes de abril de 2025), Mythos Preview logró una tasa de éxito del 73%. AISI también construyó “The Last Ones” (TLO), un escenario simulado de ataque a redes empresariales de 32 pasos, que cubre todo el proceso desde el reconocimiento inicial hasta el control total de la red, que requiere aproximadamente 20 horas para que un humano lo complete. Mythos Preview es el primer modelo en completar todo el proceso, logrando completar 3 de 10 pruebas en su totalidad, con un promedio de 22 pasos en todos los intentos. Claude Opus 4.6 quedó en segundo lugar, con un promedio de 16 pasos. AISI explicó que todos los resultados anteriores se lograron en condiciones controladas, con acceso a la red claramente guiado y proporcionado. El entorno de prueba difiere significativamente de una red empresarial real: no hay defensores activos, ni herramientas de defensa, y activar alertas de seguridad no conlleva penalización. Por lo tanto, no se puede confirmar si Mythos Preview puede vulnerar sistemas con protección estricta. Hace dos años, los mejores modelos de IA apenas podían completar tareas básicas de red. AISI señaló que la velocidad de estos avances requiere que los métodos de evaluación de seguridad también se actualicen, y en el futuro se seguirán realizando pruebas en entornos simulados con defensa activa y respuesta en tiempo real. (Fuente: BlockBeats)

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado