Experto en ciberseguridad: Los modelos de IA tan peligrosos como Claude Mythos simplemente no se pueden detener, estarán por todas partes en 24 meses

La administración de Trump la semana pasada, bajo el pretexto de seguridad nacional, obligó a Anthropic a retirar los dos modelos más potentes, Claude Fable 5 y Mythos 5. La razón es que "pueden ser jailbroken". Sin embargo, expertos en ciberseguridad desacreditaron la medida, diciendo que esta regulación solo afecta a una empresa y a unos pocos modelos; en 6 a 24 meses, capacidades similares estarán ampliamente disponibles desde múltiples fuentes.
(Resumen previo: gastar mucho dinero para crecer! Los archivos filtrados de OpenAI revelan que "las operaciones tienen una pérdida de 20.9 mil millones de dólares", y se espera que solo en 2030 sean rentables)
(Información adicional: CZ elogió Hyperliquid como un invento excelente, pero bromeó diciendo que sin KYC es demasiado peligroso: "Lo he vivido, lo mejor sería que tengan abogados muy fuertes")

El fin de semana pasado, la administración de Trump, alegando riesgos para la seguridad nacional, obligó a retirar dos modelos recientes de Anthropic: Claude Fable 5 y Mythos 5. La lógica de la Casa Blanca es: Fable 5 está abierto al público, pero su protección (en pocas palabras, el mecanismo de seguridad que evita que el modelo responda a preguntas dañinas) puede ser desactivada, lo que se considera un riesgo para la seguridad nacional.

Anthropic todavía está negociando con la Casa Blanca las condiciones para volver a ponerlos en línea, y aún no está claro cuándo volverán a estar disponibles.

Esta es una espada de doble filo, Anthropic también lo sabe

Mythos 5 no es un modelo de lenguaje ordinario. Desde que Anthropic lanzó por primera vez en abril bajo el nombre de "Mythos Preview", la compañía advirtió sobre sus riesgos. En pocas palabras, en manos de investigadores de ciberseguridad es una herramienta defensiva, pero en manos de actores maliciosos puede ser un arma de ataque.

Por eso, Mythos 5 inicialmente solo se distribuyó en privado a un selecto grupo de la alianza del equipo de Project Glasswing; mientras que Fable 5, aunque está abierto al público en general, tiene bloqueos específicos en temas de biología y seguridad cibernética.

6 meses vs 24 meses

A pesar de que la administración de Trump ordenó bloquearlo, Logan Graham, jefe del equipo de red team de Anthropic, dejó claro en abril, cuando se lanzó Mythos Preview, a WIRED:

"La verdadera noticia es que esto no se trata solo de este modelo o de Anthropic. Tenemos que prepararnos ahora para un mundo en el que, en 6, 12 o 24 meses, estas capacidades serán ampliamente accesibles."

El director de seguridad de TPO Group, Tarah Wheeler, fue aún más directo:

"Pensar que no hay otros competidores desarrollando capacidades similares a Mythos, o incluso que todavía no lo han logrado, es extremadamente miope. Otras empresas están siguiendo de cerca a Anthropic, y probablemente ya tengan estas capacidades, solo que están en modo de espera, observando cómo será tratado Anthropic en el actual entorno regulatorio."

El investigador de Harvard Bruce Schneier también señaló a WIRED: "Esta es una tendencia general en la tecnología. Modelos más pequeños, más baratos y de código abierto, a veces solos, a veces en colaboración, pueden igualar el rendimiento de Mythos con indicaciones más sofisticadas. Deberíamos esperar que otros modelos puedan igualar la creatividad y resiliencia de Mythos/Fable en unos meses, y los modelos de código abierto un poco más tarde."

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado