Anthropic, junto con 12 grandes empresas, lanza el plan «Alas de Vidrio», para reparar las vulnerabilidades globales del software utilizando el modelo más potente aún no publicado, Mythos

Autor: Anthropic

Traducción: Deep Tide TechFlow

Lectura guiada por Deep Tide: Anthropic lanzó un modelo de vanguardia Claude Mythos Preview que aún no se ha hecho público. Su capacidad de auditoría de código ya supera a la gran mayoría de los expertos humanos en seguridad, y puede descubrir de forma autónoma vulnerabilidades de día cero que han permanecido durante decenas de años.

Con base en esta capacidad, Anthropic, junto con AWS, Apple, Google, Microsoft, NVIDIA y otras 12 grandes tecnológicas, inició el plan Project Glasswing, con un cupo de crédito de 100 millones de dólares. El objetivo es, antes de que los atacantes obtengan capacidades equivalentes, cerrar las brechas de seguridad en el software clave a nivel mundial.

Introducción

Hoy anunciamos Project Glasswing (Plan Alas de Vidrio), una nueva iniciativa que reúne a Amazon Web Technology (AWS), Anthropic, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan, la Linux Foundation, Microsoft, NVIDIA y Palo Alto Networks. El objetivo es proteger la seguridad del software más crítico a nivel mundial.

Lanzamos Project Glasswing porque un nuevo modelo de vanguardia entrenado por Anthropic demostró una capacidad que creemos que puede reconfigurar el panorama de la ciberseguridad. Claude Mythos Preview es un modelo de vanguardia genérico que aún no se ha publicado. Revela una dura realidad: la capacidad de codificación de los modelos de IA ya ha alcanzado un nivel tal que, al descubrir y explotar vulnerabilidades de software, pueden superar a todos excepto a los expertos más destacados.

Mythos Preview ya ha descubierto miles de vulnerabilidades de alto riesgo, abarcando cada sistema operativo y cada navegador web principales. A la velocidad a la que avanza la IA, esta capacidad se difundirá en un futuro cercano y podría caer en manos de usuarios irresponsables. El impacto en la economía, la seguridad pública y la seguridad nacional podría ser muy grave. Project Glasswing es un intento urgente por priorizar estas capacidades para la defensa.

Como parte de Project Glasswing, los socios mencionados utilizarán Mythos Preview en su trabajo defensivo de ciberseguridad. Anthropic compartirá las lecciones aprendidas para que todo el sector se beneficie. También abrimos el acceso a más de 40 organizaciones que construyen o mantienen infraestructuras críticas de software, para que puedan escanear y reforzar sus propios sistemas y sistemas de código abierto. Anthropic se compromete a invertir hasta 100 millones de dólares en su cupo de uso de Mythos Preview, y 4 millones de dólares en donaciones directas a organizaciones de seguridad de código abierto.

Project Glasswing es solo un punto de partida. Ninguna institución puede resolver por sí sola los problemas de ciberseguridad: los desarrolladores de IA de vanguardia, otras empresas de software, los investigadores de seguridad, los mantenedores de código abierto y los gobiernos de todo el mundo tienen roles insustituibles. Defender la infraestructura de red global podría requerir años; mientras que las capacidades de IA de vanguardia podrían dar un salto significativo en pocos meses. Para que los defensores de redes se adelanten, deben actuar ahora.

Ciberseguridad en la era de la IA

El software del que dependemos a diario —para ejecutar sistemas bancarios, almacenar historiales médicos, conectar redes logísticas y mantener en funcionamiento la red eléctrica— siempre ha tenido bugs. La mayoría son poco relevantes, pero algunos son fallas de seguridad graves que, una vez descubiertas, permiten a los atacantes secuestrar sistemas, paralizar operaciones o robar datos.

Las consecuencias destructivas de los ciberataques sobre las redes empresariales, los sistemas de atención médica, la infraestructura energética, los nodos de transporte y las agencias gubernamentales de distintos países son bien conocidas. A escala global, los ataques a nivel estatal provenientes de China, Irán, Corea del Norte y Rusia han puesto en riesgo infraestructuras que sustentan la vida civil y la preparación militar. Incluso los ataques a pequeña escala contra un solo hospital o escuela pueden causar grandes pérdidas económicas, exponer datos sensibles e incluso poner vidas en peligro. Las pérdidas económicas anuales de la ciberdelincuencia global son difíciles de estimar con precisión, pero podrían rondar los 500 mil millones de dólares.

Antes, muchas fallas de software no se descubrían durante años porque encontrar y explotarlas requería conocimientos profesionales que solo poseían unos pocos expertos en seguridad. Pero con la aparición de los más recientes modelos de IA de vanguardia, los costos, el esfuerzo y los umbrales de experiencia necesarios para descubrir y explotar vulnerabilidades de software se han reducido drásticamente. En el último año, los modelos de IA han mejorado cada vez más en lectura de código y razonamiento, y en particular han mostrado un desempeño asombroso al descubrir vulnerabilidades y construir formas de explotación. Claude Mythos Preview logró una mejora de gran salto en estas habilidades de ciberseguridad: algunas vulnerabilidades que detectó han sobrevivido a revisiones humanas durante décadas y a millones de pruebas de seguridad automatizadas, y además el código de explotación que desarrolló se ha vuelto cada vez más sofisticado.

Diez años después de la primera edición del Concurso de Ciberseguridad de gran escala de DARPA, los modelos de IA de vanguardia se acercan e incluso empatan con la capacidad más alta de los humanos en descubrimiento y explotación de vulnerabilidades. Si no se implementan medidas de seguridad necesarias, estas poderosas capacidades de red podrían usarse para explotar la gran cantidad de fallas existentes en el software más importante del mundo. Los ciberataques se volverán más frecuentes y más destructivos, y también darán poder a los adversarios de Estados Unidos y sus aliados. Esta es una prioridad de seguridad que las democracias deben tomar en serio.

La buena noticia es que las capacidades que hacen peligrosa la IA cuando está en manos equivocadas, también la vuelven extremadamente valiosa para descubrir y corregir fallas importantes del software; además, pueden ayudar a producir software nuevo con menos bugs de seguridad. Project Glasswing es un paso esencial para que los defensores establezcan una ventaja duradera en el próximo futuro de ciberseguridad impulsada por IA.

Capacidades de ciberseguridad de alto nivel de Claude Mythos Preview para descubrir vulnerabilidades y formas de explotación

En las últimas semanas, usamos Claude Mythos Preview para descubrir miles de vulnerabilidades de día cero (es decir, defectos que los desarrolladores de software no conocían previamente) en cada sistema operativo principal, en cada navegador principal y en una serie de otros softwares importantes; muchas de ellas eran de nivel alto.

En el blog de Frontier Red Team, divulgamos los detalles técnicos de parte de las vulnerabilidades que ya fueron corregidas, así como las formas de explotación halladas por Mythos Preview. Casi todos los descubrimientos de estas vulnerabilidades (y el desarrollo de muchas de las explotaciones relacionadas) los realizó el modelo de manera completamente autónoma, sin ninguna guía humana. A continuación, tres ejemplos:

Mythos Preview descubrió una vulnerabilidad con 27 años de antigüedad en OpenBSD. OpenBSD es conocido por su altísimo nivel de reforzamiento de seguridad, y se usa ampliamente en cortafuegos y otras infraestructuras críticas. La vulnerabilidad permite que un atacante haga que el sistema objetivo se bloquee remotamente solo al conectarse a él.

También descubrió una vulnerabilidad de 16 años en FFmpeg. FFmpeg se utiliza en infinidad de softwares para codificación y decodificación de video. El problema estaba en una sola línea de código y las herramientas de pruebas automatizadas habían acertado esa línea 5 millones de veces, pero nunca detectaron el problema.

El modelo descubrió de forma autónoma y encadenó varias vulnerabilidades en el kernel de Linux (el kernel de Linux ejecuta la mayor parte de los servidores del mundo), logrando un ataque de escalamiento de privilegios que va desde permisos de usuario normales hasta el control total de la máquina.

Ya hemos reportado todas las vulnerabilidades anteriores a los responsables de mantener el software correspondiente y en todos los casos ya se han corregido. Para muchas otras vulnerabilidades, hoy proporcionamos los detalles de hashes de cifrado (ver el blog de Red Team), que se harán públicos cuando la corrección esté completa.

Los puntos de referencia de evaluación, como CyberGym, también verificaron una brecha significativa entre Mythos Preview y nuestro modelo más fuerte siguiente, Claude Opus 4.6:

Reproducción de vulnerabilidades de ciberseguridad - CyberGym

Además de nuestro propio trabajo, muchos socios también han usado Claude Mythos Preview durante varias semanas. A continuación, sus comentarios:

«Las capacidades de IA ya superaron un umbral y cambiaron fundamentalmente la urgencia necesaria para proteger infraestructuras críticas de las amenazas cibernéticas, y de manera irreversible. Con nuestro trabajo de base con estos modelos, demostramos que es posible identificar y corregir vulnerabilidades de hardware y software a una velocidad y escala sin precedentes. Este es un cambio profundo y una señal clara: ya no basta con los métodos antiguos de reforzamiento del sistema. Los proveedores de tecnología deben adoptar de inmediato métodos nuevos de manera proactiva, y los clientes deben prepararse para el despliegue. Esa es la razón por la que Cisco se unió a Project Glasswing: esto es demasiado importante, demasiado urgente, para hacerlo en solitario.»

— Anthony Grieco, vicepresidente sénior y director de seguridad y confianza de Cisco

«En AWS, construimos defensas antes de que aparezcan las amenazas: desde chips personalizados hasta todo el stack tecnológico. La seguridad no es algo que sucede en una etapa; es continua y está integrada en todo lo que hacemos. Nuestro equipo analiza más de 4 millones de billones de veces el tráfico de red cada día para detectar amenazas, y la IA es el núcleo de nuestra capacidad de defensa a gran escala. Hemos estado probando Claude Mythos Preview de forma continua en nuestras operaciones de seguridad, lo hemos aplicado a repositorios de código críticos y ya nos está ayudando a reforzar el código. Estamos inyectando conocimientos profundos de seguridad en nuestra colaboración con Anthropic y ayudando a fortalecer Claude Mythos Preview para que más organizaciones puedan avanzar con los estándares de seguridad más altos.»

— Amy Herzog, vicepresidenta de AWS y directora de información de AWS

«Cuando la ciberseguridad deja de estar limitada a la capacidad puramente humana, la oportunidad de usar IA de manera responsable para mejorar la seguridad a gran escala y reducir riesgos es inédita. Al unirnos a Project Glasswing y obtener acceso a Claude Mythos Preview, podemos identificar y mitigar riesgos con antelación, y fortalecer nuestras soluciones de seguridad y desarrollo para proteger mejor a nuestros clientes y a Microsoft. Al probarlo en nuestro benchmark de seguridad de código abierto CTI-REALM, Claude Mythos Preview mostró mejoras sustanciales frente a los modelos anteriores. Esperamos colaborar con Anthropic y con un sector más amplio para mejorar los resultados de seguridad para todos.»

— Igor Tsyganskiy, vicepresidente ejecutivo de ciberseguridad de Microsoft y de Microsoft Research

«La ventana de tiempo entre el descubrimiento de una vulnerabilidad y su explotación por parte de un atacante se ha colapsado: lo que antes tomaba meses, ahora se puede hacer en minutos con IA. Claude Mythos Preview muestra la posibilidad de que los defensores actúen a gran escala, mientras que el adversario buscará inevitablemente explotar la misma capacidad. Esto no es una razón para frenar, sino una razón para acelerar juntos. Para desplegar IA, es necesario contar con garantías de seguridad. Esa es la razón por la que CrowdStrike participa desde el primer día.»

— Elia Zaitsev, CTO de CrowdStrike

«Antes, la experiencia en seguridad era un lujo que solo podían permitirse las organizaciones con grandes equipos de seguridad. Los mantenedores de software de código abierto —cuyos programas sostienen gran parte de la infraestructura crítica del mundo— históricamente solo han tenido que arreglárselas para resolver problemas de seguridad por su cuenta. El software de código abierto constituye la mayor parte del código en los sistemas modernos, incluido el sistema en sí que las entidades de IA usan para escribir nuevo software. Al permitir que los mantenedores de estos repositorios críticos de código abierto obtengan acceso a una nueva generación de modelos de IA —capaces de identificar y corregir vulnerabilidades de manera proactiva a gran escala— Project Glasswing ofrece una vía concreta para cambiar esta situación. Así es como la seguridad mejorada con IA puede pasar de ser una herramienta exclusiva para grandes equipos a convertirse en un asistente confiable para cada mantenedor.»

— Jim Zemlin, CEO de Linux Foundation

«Promover la ciberseguridad y la resiliencia del sistema financiero es la esencia de la misión de JPMorgan. Creemos que cuando las instituciones líderes desafían este tema juntas, la industria es más fuerte. Project Glasswing ofrece una oportunidad temprana y única para que evaluemos, con nuestros propios estándares, las capacidades de las próximas herramientas de IA en ciberseguridad defensiva para infraestructuras críticas, mientras combatimos al lado de líderes tecnológicos respetados. Adoptaremos un enfoque riguroso e independiente para determinar cómo avanzar y cómo ayudar. La iniciativa de Anthropic refleja el enfoque visionario y colaborativo que se requiere en este momento.»

— Pat Opet, CISO de JPMorgan

«Nos complace ver que esta iniciativa de ciberseguridad a través de industrias toma forma y que los participantes reciban Mythos Preview mediante Vertex AI. La colaboración de la industria en temas de seguridad emergentes siempre ha sido crucial, ya sea criptografía post-cuántica, divulgación responsable de vulnerabilidades de día cero, seguridad de software de código abierto o la defensa contra ataques basados en IA. Siempre hemos creído que la IA en la defensa de redes trae nuevos desafíos y también nuevas oportunidades. Esa es la razón por la que construimos herramientas impulsadas por IA como Big Sleep y CodeMender para descubrir y corregir fallas críticas en software. Continuaremos invirtiendo en plataformas líderes de ciberseguridad y en una cultura centrada en proteger a los usuarios, clientes, el ecosistema y la seguridad nacional.»

— Heather Adkins, vicepresidenta de ingeniería de seguridad de Google

«En las últimas semanas, hemos estado usando el modelo Claude Mythos Preview para identificar vulnerabilidades complejas que los modelos de la generación anterior habían omitido por completo. Esto no solo cambió las reglas del juego para descubrir vulnerabilidades ocultas, sino que también significa que los atacantes pronto podrán descubrir más vulnerabilidades de día cero y desarrollar código de explotación con mayor rapidez que antes. Está claro que estos modelos deben estar en manos de los propietarios de proyectos de código abierto y de todos los defensores, para descubrir y corregir las vulnerabilidades antes de que los atacantes obtengan acceso. Y quizás más importante: todos deben prepararse para ataques asistidos por IA. Los ataques serán más numerosos, más rápidos y más complejos. Ahora es el momento de actualizar de forma integral el sistema de ciberseguridad. Agradecemos la colaboración de Anthropic con la industria para asegurar que estas poderosas capacidades se prioricen para la defensa.»

— Lee Klarich, CTO de Palo Alto Networks

Las sólidas capacidades de ciberseguridad de Claude Mythos Preview provienen de su excepcional capacidad de codificación y razonamiento de agentes. Los siguientes resultados de evaluación muestran que este modelo obtiene las puntuaciones más altas entre todos los modelos conocidos en múltiples tareas de codificación de software.

Codificación de agentes

Razonamiento

Búsqueda de agentes y uso de computadoras

Notas:

SWE-bench Verified, Pro y Multilingual: la exploración con memoización marca algunas tareas. Al excluir las tareas que podrían tener memoización, la magnitud de la ventaja de Mythos Preview sobre Opus 4.6 no cambia.

SWE-bench Multimodal: usa implementaciones internas; la puntuación no se puede comparar directamente con las del ranking público.

Terminal-Bench 2.0: usa el framework Terminus-2, esfuerzo máximo en el modo de pensamiento adaptativo, presupuesto total por tarea de 1 millón de tokens, configuración de recursos 1x de garantía / límite superior de 3x, y 5 intentos por tarea promediados. Al aumentar el límite de tiempo a 4 horas y actualizar con Terminal-Bench 2.1, Mythos Preview obtiene 92.1%.

BrowseComp: Claude Mythos Preview obtiene una puntuación más alta que Opus 4.6, mientras que el consumo de tokens es solo 1/4.9 del de este último.

Humanity’s Last Exam: Mythos se desempeña bien incluso en modo de bajo esfuerzo; puede existir cierta memoización.

Para más información sobre las capacidades del modelo, atributos de seguridad y características básicas, consulte la ficha del sistema de Claude Mythos Preview.

No planeamos abrir Claude Mythos Preview al público, pero el objetivo final es permitir que los usuarios desplieguen de manera segura a gran escala modelos de nivel Mythos: no solo para ciberseguridad, sino también para muchos otros valores que este tipo de modelos de alta capacidad aportará. Para ello, necesitamos avanzar en el desarrollo de medidas de seguridad (de ciberseguridad y otras) que puedan detectar y bloquear las salidas más peligrosas del modelo. Planeamos publicar nuevas salvaguardas de seguridad en el próximo modelo Claude Opus, para que podamos mejorar y perfeccionar estas medidas con un modelo que no tenga el mismo nivel de riesgo que Mythos Preview.

Plan a seguir de Project Glasswing

El lanzamiento de hoy es el comienzo de un esfuerzo a largo plazo. Para que tenga éxito, se requiere una participación amplia dentro y fuera de la industria tecnológica.

Los socios de Project Glasswing obtendrán acceso a Claude Mythos Preview para descubrir y corregir vulnerabilidades y debilidades en sus sistemas base —estos sistemas representan una gran proporción de la superficie de ataque compartida global. Se espera que los focos del trabajo incluyan detección de vulnerabilidades locales, pruebas de caja negra de binarios, reforzamiento de endpoints y pruebas de intrusión de sistemas.

El cupo de uso de 100 millones de dólares de modelos que Anthropic se compromete a brindar para Project Glasswing y para otros participantes cubrirá gran parte del uso durante la fase de investigación preliminar. Después, Claude Mythos Preview estará disponible para los participantes al precio de 25 dólares / 125 dólares por cada millón de tokens de entrada / salida (los participantes podrán acceder a este modelo a través de Claude API, Amazon Bedrock, Google Cloud Vertex AI y Microsoft Foundry).

Además del cupo de uso del modelo, a través de Linux Foundation también donamos 2.5 millones de dólares a Alpha-Omega y 1.5 millones de dólares a OpenSSF para ayudar a los mantenedores de software de código abierto a afrontar este cambio en el panorama (los mantenedores interesados pueden solicitar acceso mediante el plan Claude for Open Source).

Pretendemos hacer que este trabajo se expanda de manera continua en alcance durante varios meses y compartir la mayor cantidad posible de experiencias, para que otras organizaciones puedan aplicar estos aprendizajes a su propia seguridad. Los socios compartirán información y mejores prácticas entre sí dentro de los límites permitidos por las condiciones; en un plazo de 90 días, Anthropic publicará un informe con nuestros hallazgos, así como las vulnerabilidades corregidas y las medidas de mejora que se puedan divulgar. También colaboraremos con organizaciones líderes de seguridad para formular un conjunto de recomendaciones prácticas sobre la evolución de las prácticas de seguridad en la era de la IA, que posiblemente abarque: procesos de divulgación de vulnerabilidades, procesos de actualización de software, seguridad de código abierto y de la cadena de suministro, el ciclo de vida del desarrollo de software y prácticas de diseño de seguridad, estándares de la industria bajo regulación, ampliación por triaje y automatización, así como automatización de parches.

Anthropic también ha venido conversando con funcionarios del gobierno de Estados Unidos sobre las capacidades de ciberseguridad ofensiva y defensiva de Claude Mythos Preview. Proteger infraestructuras críticas es una prioridad nacional de seguridad primordial de las democracias; el surgimiento de estas capacidades de ciberseguridad vuelve a demostrar que Estados Unidos y sus aliados deben mantener una ventaja decisiva en tecnología de IA. El gobierno tiene un papel indispensable para ayudar a mantener esta ventaja, así como para evaluar y mitigar los riesgos de seguridad nacional asociados a los modelos de IA. Estamos dispuestos a colaborar con representantes gubernamentales de todos los niveles para ayudar a completar estas tareas.

Esperamos que Project Glasswing impulse un esfuerzo a mayor escala que cubra tanto la industria como el sector público, para que todas las partes aborden el problema más importante del impacto en la seguridad de los modelos poderosos. Invitamos a otros miembros de la industria de IA a unirse para ayudar a definir estándares de la industria. A mediano plazo, una organización independiente de terceros —capaz de reunir organizaciones del sector privado y del sector público— podría ser la plataforma ideal para llevar adelante el trabajo posterior de estos proyectos masivos de ciberseguridad.

Apéndice

Este proyecto lleva el nombre de la mariposa alas de cristal (Greta oto). Esta metáfora tiene dos capas de significado: las alas transparentes de la mariposa le permiten pasar desapercibida, como las vulnerabilidades que se esconden en el código que se discuten en este artículo; las alas transparentes también le ayudan a evitar daños, como el enfoque transparente que promovemos.

La palabra Mythos proviene del griego antiguo y significa «narración» o «historia»: un sistema de historias que la civilización usa para comprender el mundo.

Los profesionales de seguridad que realizan trabajos legítimos que se vean afectados por estas salvaguardas pueden solicitar el próximo Cyber Verification Program (programa de verificación de ciberseguridad).

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado