¿Momento de DeepSeek 2.0? La capitalización de Zhipu supera los 1 billón de yuanes, GLM-5.2 acapara la atención

Autor: Xu Chao, Wall Street Jingwen

Este lunes, la capitalización total del mercado en Hong Kong de Zhipu superó los 1 billón de HKD durante la sesión, con un aumento superior al 1900% en lo que va del año. Esto no es solo una tendencia de una acción individual: el lanzamiento del gran modelo de código abierto chino GLM-5.2 está redefiniendo los límites de la capacidad de IA global, y también ha llevado la discusión de "DeepSeek 2.0" a la mesa de negociación de Wall Street.

En términos de rendimiento, GLM-5.2 obtuvo una puntuación de 74.4 en el benchmark de programación a largo plazo FrontierSWE, solo aproximadamente 1 punto porcentual por debajo de los 75.1 del modelo de élite de Anthropic Opus 4.8, y superó los 72.6 de GPT-5.5, convirtiéndose en el modelo de código abierto con la puntuación más alta hasta ahora, con un precio aproximadamente un 72% a 82% menor que Opus 4.8.

Casi al mismo tiempo, Anthropic se vio obligado a cerrar el acceso global a sus modelos insignia Fable 5 y Mythos 5 —el Departamento de Comercio de EE. UU. intervino citando regulaciones de control de exportaciones, exigiendo obtener permisos gubernamentales antes de ofrecer servicios relacionados a extranjeros. La superposición de estas noticias hizo que la narrativa de "restricciones en EE. UU. y apertura en China" se consolidara instantáneamente.

A diferencia del impacto de DeepSeek a principios de 2025, en esta ronda no se retiraron fondos de Nvidia ni de las acciones de IA en EE. UU., sino que el flujo de inversión se concentró en activos chinos, mostrando características de transacción alternativa en lugar de una liquidación por pánico. La cuestión central que el mercado está reevaluando es: ¿ha ocurrido un cambio estructural en la competencia de la cadena de valor de la IA, dado que los modelos de código abierto de alto rendimiento pueden ofrecer capacidades similares a menos de una décima parte del costo de los modelos cerrados, y las políticas estadounidenses cortan directamente la accesibilidad global a los modelos cerrados?

GLM-5.2: La entrada del código abierto en la frontera de la competencia cerrada

El significado central de GLM-5.2 radica en que lleva los modelos de código abierto al rango de rendimiento previamente dominado por laboratorios cerrados.

Según datos publicados por Zhipu, GLM-5.2 tiene un tamaño de 753 mil millones de parámetros, utiliza una arquitectura MoE (experto híbrido), soporta una ventana de contexto estable de 1 millón de tokens, y es completamente de código abierto bajo la licencia MIT. En el benchmark de programación FrontierSWE, obtuvo 74.4 puntos, comparado con 75.1 de Opus 4.8 de Anthropic, con una diferencia de aproximadamente 1 punto porcentual, y superó los 72.6 de GPT-5.5. En el benchmark PostTrainBench (que evalúa la capacidad de entrenamiento de pequeños modelos de agentes), GLM-5.2 obtuvo 34.3 puntos, en segundo lugar solo detrás de Opus 4.8 con 37.2, y por encima de GPT-5.5 con 28.4.

Artificial Analysis calificó a GLM-5.2 con 51 puntos en su índice de inteligencia v4.1, liderando a MiniMax-M3 (44), DeepSeek V4 Pro (44) y Kimi K2.6 (43), colocándolo entre GPT-5.5 y Opus 4.8, siendo el modelo de código abierto con la puntuación más alta hasta ahora. El investigador comunitario @jeremyphoward表示 afirmó que "GLM-5.2 es al menos comparable con Opus 4.8 y GPT-5.5"; @matvelloso称其为 "el primer modelo de código abierto que cumple con mis estándares de uso diario".

Aún existen diferencias. En el benchmark de mayor dificultad SWE-Marathon, GLM-5.2 obtuvo 13.0 puntos, mientras que Opus 4.8 alcanzó 26.0; la falta de capacidades visuales sigue siendo una limitación actual. Sin embargo, desde la perspectiva de despliegue técnico, la tecnología IndexShare introducida por GLM-5.2 —que reutiliza la atención dispersa en capas mediante índices top-k— reduce significativamente la carga computacional para inferencias con contextos muy largos, haciendo que el costo de 1 millón de tokens sea mucho más factible. La institución de investigación en IA Proximal afirmó que GLM-5.2 es "el primer modelo que realmente reduce la brecha tecnológica enorme entre Anthropic/OpenAI y otros proveedores".

Lógica de precios: las actualizaciones de capacidades de frontera aún pueden sostener primas

La estructura de precios de GLM-5.2 ofrece un nuevo marco de referencia para la valoración de modelos de IA.

El precio por token de entrada/salida de GLM-5.2 es aproximadamente un 72% a 82% menor que el de Opus 4.8. Sin embargo, JPMorgan en su informe señaló que, en comparación con GLM-5.1, en realidad hubo un aumento de precio: GLM-5.1 utilizaba una tarifa escalonada, permitiendo tarifas más bajas para ciertos volúmenes; GLM-5.2 aplica una tarifa uniforme más alta, por lo que el precio medio pagado por los clientes aumenta. Dado que la mejora en rendimiento proviene principalmente de aprendizaje reforzado y optimización post-entrenamiento, en lugar de una expansión masiva del tamaño del modelo, los costos básicos permanecen estables, y este ajuste podría mejorar el margen bruto de Z.ai.

Según JPMorgan, "los precios de modelos inteligentes maduros se están comprimiendo, pero GLM-5.2 muestra que las actualizaciones de frontera pueden tener efectos opuestos". La firma sostiene que los precios de los modelos de IA están mostrando una diferenciación estructural: capacidades básicas como diálogo, resúmenes simples y asistencia con código estándar ya están comercializadas y seguirán enfrentando presión a la baja; DeepSeek es un ejemplo típico de esta tendencia; mientras que capacidades de frontera que desbloquean nuevos flujos de trabajo y mejoran la tasa de finalización de tareas —especialmente en programación, agentes, automatización de flujos empresariales y tareas de contexto largo—, pueden mantener o incluso aumentar sus precios bajo la lógica de "pagar por completar tareas, no por tokens".

Para los inversores, esta diferenciación tiene implicaciones directas en la valoración: la monetización de las empresas en la capa de modelos dependerá de su capacidad para avanzar hacia tareas más difíciles y de mayor valor, en lugar de simplemente escalar sus capacidades existentes.

Retiro de modelos de Anthropic: el riesgo de accesibilidad cerrada pasa de concepto a realidad

El retiro repentino de Fable 5 y Mythos 5 convierte el riesgo de accesibilidad a modelos comerciales cerrados en una amenaza concreta.

Según Bloomberg, Howard Lutnick citó la sección 744.22(b) del Reglamento de Administración de Exportaciones, alegando que estos modelos presentan un "riesgo inaceptable" de ser utilizados por agencias de inteligencia militar extranjeras, y exige que Anthropic obtenga una licencia del Departamento de Comercio antes de ofrecer acceso a extranjeros en todo el mundo, bajo pena de sanciones penales y civiles.

Un informe de Orient Securities, citando medios, indica que investigadores de Amazon lograron superar las restricciones de seguridad de Mythos y descubrieron vulnerabilidades en al menos cuatro programas de software en Fable 5 mediante indicaciones específicas, lo que se considera un desencadenante clave para la intervención regulatoria. Anthropic respondió cerrando el acceso global a ambos modelos y advirtiendo que la respuesta gubernamental es "desproporcionada", y que si se extiende a toda la industria, todos los despliegues de modelos de frontera podrían quedar prácticamente paralizados.

Según Wall Street Jingwen, el equipo técnico de Anthropic se reunió este lunes con funcionarios del Departamento de Comercio de EE. UU.

Se considera que este evento impacta en la cadena de valor en dos niveles: primero, las empresas y desarrolladores que dependen de modelos de frontera cerrados enfrentan riesgos de continuidad operativa, aumentando la demanda de alternativas; segundo, los modelos de código abierto con pesos disponibles y capacidad de despliegue local tienen ventajas naturales en control, y GLM-5.2 ofrece una opción con rendimiento cercano a la frontera y costos mucho menores en este momento.

Esta tendencia regulatoria también ha despertado gran interés en otros laboratorios de IA. Fuentes informadas revelan que Jason Kwon, director de estrategia de OpenAI, notificó a los empleados que la compañía está evaluando el impacto de esta política, describiendo la situación actual como "una evolución rápida con muchas incógnitas". Che Chang, asesor legal principal de OpenAI, advirtió en un mensaje interno que, al enfrentar la incertidumbre regulatoria, "no se debe intentar coordinar respuestas, ya que las reglas antimonopolio aplican en este contexto".

Percepción del mercado: transacciones alternativas en lugar de pánico de liquidación, la prosperidad del poder computacional se mantiene

Este ciclo de mercado difiere fundamentalmente de la estructura del mercado tras el evento DeepSeek, pero la lógica a medio y largo plazo de la industria está siendo reevaluada.

El impacto de DeepSeek fue un cisne negro inesperado que provocó ventas en el sector de IA en EE. UU. El lanzamiento de GLM-5.2, en cambio, fue un evento altamente anticipado —el mercado ya había digerido en 18 meses las expectativas sobre la competitividad de los modelos de código abierto chinos—, y la validación actual se refleja en una reevaluación de los activos de IA locales en China, sin un impacto sistémico en las acciones de IA en EE. UU. JPMorgan calificó esta tendencia como "transacción alternativa" en lugar de "pánico de liquidación". Tras elevar el precio objetivo de Zhipu a 1800 HKD, su acción ya cotiza cerca de 2400 HKD, superando incluso esa meta, lo que indica que la valoración del mercado ya va más allá de las predicciones de los analistas.

Orient Securities opina que varias empresas chinas de modelos mantienen posiciones líderes en los rankings globales y muchas siguen siendo de código abierto; además, con la retirada de los modelos principales de Anthropic, se espera que la demanda de llamadas API para modelos nacionales aumente aún más, y que la demanda de servicios de tokens y poder computacional basado en modelos nacionales continúe creciendo con buen ritmo y prosperidad.

Rich Privorotsky también advierte que el sector de IA enfrenta una lucha entre dos fuerzas: por un lado, la aceleración de la adopción y la demanda de poder computacional; por otro, la contracción de tokens, la duda sobre la monetización y la expansión continua de la oferta de acciones, que generan mayor atención en lo segundo. Sin embargo, desde una lógica de industria a largo plazo, la reducción de costos y la disminución de barreras de acceso podrían impulsar simultáneamente el consumo de tokens y la demanda de poder computacional. Los analistas señalan que el aumento en la cuota de modelos de código abierto y la alta demanda de poder computacional se están convirtiendo en variables clave para la reevaluación de la cadena de valor de la IA.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado