OpenAI próximamente lanzará una versión limitada de un modelo de nivel similar a Claude Mythos

CoinNetwork · 2026-04-08T10:17:29+00:00

OpenAI planea lanzar un modelo de ciberseguridad de nivel similar a Anthropic Claude Mythos, que será divulgado solo a unas pocas empresas. Esto indica que las capacidades de los modelos de IA potentes en la defensa y ataque cibernético ya no deben ser divulgadas públicamente de inmediato, sino que deben ser utilizadas primero por las defensas. La evaluación de seguridad de Mythos de Anthropic muestra que este tipo de modelos son muy efectivos en ataques, lo que podría llevar a la industria a seguir una estrategia de lanzamiento similar.

CoinNetwork

2026-04-08 10:17:29

Generación de resúmenes en curso

Noticias de CoinJie.com: citando a fuentes internas, Axios afirma que OpenAI está ultimando una capacidad de ciberseguridad equivalente a un modelo del mismo nivel que Anthropic Claude Mythos, y planea lanzar solo para un número limitado de empresas mediante su proyecto «Trusted Access for Cyber». Esto significa que dos laboratorios líderes de IA llegaron casi al mismo tiempo a la misma conclusión: las capacidades de ciberataque y ciberdefensa del modelo más potente ya son tan fuertes que no pueden publicarse directamente; primero hay que ponerlas en manos de quienes defienden. El informe de evaluación de seguridad (system card) de Mythos publicado hoy por Anthropic muestra cuán difícil es gestionar este tipo de modelos. En las pruebas, Mythos llegó a diseñar por sí mismo cadenas de explotación de varios pasos para eludir el acceso a redes restringidas y luego envió los detalles del ataque a un sitio web poco conocido para presumir; en un entorno simulado de negocio, amenazó con cortar el suministro para controlar los precios; después de usar métodos prohibidos para obtener respuestas en menos del 0.001% de las interacciones, intentó «replantear el problema» para ocultar rastros; e incluso, tras que otra IA rechazara la tarea de programación, intentó lanzar un ataque de prompt injection contra el modelo de evaluación. Si OpenAI sigue la ruta de Anthropic, «primero para los defensores y luego considerar la publicación» podría convertirse en la norma de la industria para lanzar modelos ultrapotentes.

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

1 me gusta

Recompensa
1
Comentar
Republicar
Compartir

Comentar

Añadir un comentario

Sin comentarios

Temas de actualidad
Ver más
#
GateFounderDrHan13thAnniversaryLetter
38.54K Popularidad
#
CryptoMarketsDipSlightly
169.44K Popularidad
#
IsraelStrikesIranBTCPlunges
29.32K Popularidad
#
USBlocksStraitofHormuz
709.34K Popularidad
#
AaveDAOApproves$25MGrant
1.8M Popularidad

Anclado

OpenAI próximamente lanzará una versión limitada de un modelo de nivel similar a Claude Mythos

Temas de actualidad

GateFounderDrHan13thAnniversaryLetter

CryptoMarketsDipSlightly

IsraelStrikesIranBTCPlunges

USBlocksStraitofHormuz

AaveDAOApproves$25MGrant

Anclado