Mythos preview devuelve la industria a la defensa: la base de seguridad de DeFi se tambalea, los recursos de IA fluyen hacia la pista de control de riesgos

robot
Generación de resúmenes en curso

Mythos Hace que la industria de IA se enfoque en la defensa: surgen varias cuestiones clave

Deedy Das, ese tuit no solo generó discusión, sino que también llevó a toda la industria a volver del “qué tan potente es el modelo” al “qué puede hacer un modelo potente y cómo regularlo”. Según información pública, Mythos Preview obtuvo 99/100 en BenchLM, puntuación perfecta en tareas proxy, y aproximadamente 94% en el estándar de codificación SWE-bench, claramente por encima de Claude Opus 4.6. Se reporta que este modelo, con menos de 50 dólares de potencia computacional, identificó una vulnerabilidad de OpenBSD de hace 27 años, y además puede encadenar vulnerabilidades del núcleo de Linux por sí mismo. Karpathy, LeCun y otros aún no han hecho declaraciones públicas, probablemente porque el modelo todavía no está abierto a investigadores independientes.

Mi juicio: la atención de la industria se está desplazando de “subir en las listas de capacidades” a “defensa y control”. Anthropic, a través del Proyecto Glasswing, busca un acceso limitado, intentando resolver primero los problemas de doble uso.

  • El acceso empresarial crea una brecha de recursos e información: Glasswing ya ha involucrado a más de 40 socios (Apple, Microsoft están en ello), con un fondo de 100 millones de dólares para escenarios de seguridad; los proyectos de código abierto difícilmente obtienen recursos similares.
  • Las hipótesis de seguridad en DeFi están siendo cuestionadas: los contratos en cadena gestionan aproximadamente 200 mil millones de dólares. Tras la pérdida de 285 millones en Drift en Solana, se lanzó el plan de seguridad STRIDE. Las herramientas para detectar vulnerabilidades en IA son cada vez más potentes, y los protocolos que no han hecho validación formal serán evaluados por los depositantes con una percepción de riesgo más estricta.
  • El dinero sigue la tendencia de “IA responsable”: tras la ronda G de Anthropic, la valoración implícita ronda los 380 mil millones de dólares, indicando una preferencia de los inversores por la seguridad. Ver si RSP 3.0 puede realmente prevenir abusos aún está por verse.

Las puntuaciones no lo son todo: si se lanza o no, depende de los umbrales de seguridad y control

Las compras empresariales consideran si “puede lanzarse de forma segura”, no la clasificación en listas. Tras filtraciones, el sector de ciberseguridad retrocedió un 5-10%, y dado que ningún competidor ha refutado públicamente, esto indica que el mercado valora más la “defensa y gestión de riesgos” que la “capacidad”.

Perspectiva Base Cambio Evaluación
Orientación a capacidades BenchLM 99/100, primera en tareas proxy, demostración interna de cadena de vulnerabilidades Firefox Expectativa elevada en desarrolladores sobre codificación y flujos de trabajo proxy en IA Puede estar sobrevalorado; la fiabilidad en producción y la puntuación no son iguales
Prioridad en seguridad Alianzas Glasswing, descubrimiento de vulnerabilidades de día cero (como la de FFmpeg de hace 16 años) Se presta atención a puntos débiles en infraestructura, y la auditoría de seguridad asistida por IA avanza Subestimado; la credibilidad de Anthropic como socio de seguridad aumenta, difícil de igualar por competidores
Cautela del mercado Retroceso en acciones de seguridad, pérdida de 285 millones en Solana Los inversores reevalúan riesgos de difusión en 6–18 meses Razonable a corto plazo; las tecnologías defensivas a largo plazo podrían tener retornos excesivos
Umbral de seguridad La evaluación RSP no alcanza el umbral de autonomía, pero el modelo aún no está en prueba pública Preferencia por modelos auditados y lanzamientos controlados en sectores regulados Marco efectivo; no amigable para investigadores, pero los compradores regulados prefieren

El consenso se está consolidando: en lugar de preguntar “¿qué más puede hacer la IA?”, mejor preguntar “¿cómo hacer que opere dentro de límites seguros?”.

Información clave

  • Mythos tiene capacidades fuertes pero solo para pilotos empresariales: altos puntajes en benchmarks, muestras de día cero reales, y acceso temprano a nivel empresarial crean una combinación de “alta capacidad + acceso restringido”.
  • Los riesgos en DeFi están siendo reevaluados: los contratos de alto valor enfrentan una aceleración en ataques y defensas con IA, y la validación formal y auditorías de seguridad con IA pasarán a ser requisitos de entrada.
  • El capital y la narrativa se vinculan: el capital y talento se concentran en “modelos potentes y controlados”, mientras que el ecosistema abierto y la investigación independiente se vuelven cada vez más marginales.
  • La lógica de decisión para lanzar cambia: los umbrales de seguridad, la capacidad de aislamiento y la auditabilidad están reemplazando a las “puntuaciones en listas” como principales criterios de compra empresarial.

Importancia: Alta
Clasificación: Lanzamiento de modelos|Seguridad en IA|Impacto en mercado

Conclusión: las empresas y los fondos ya están respaldando la estrategia defensiva de Anthropic; los constructores que no integren seguridad y los investigadores sin canales empresariales enfrentan un riesgo creciente de marginalización.

Juicio: desde la perspectiva narrativa, todavía estamos en una fase “temprana pero acelerando”; los mayores beneficiados son los constructores con capacidades de seguridad y canales regulatorios. Los traders secundarios deberían observar más los cambios en la implementación de seguridad y en los umbrales de acceso; para quienes solo tienen exposición a ecosistemas abiertos, esta situación no es favorable.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado