La primera informe financiero de Zhipu ha sido publicado, y la última declaración de Zhang Peng: redefinir los "primeros principios" de la comercialización de AGI, el límite superior de la inteligencia determina el poder de fijación de precios

¡Justo después, 83 días tras su salida a bolsa, llegó el primer informe financiero de Zhipu!

Los datos más impactantes, sin duda, son los ingresos de Zhipu——

Ingreso anual de 7240 millones de yuanes, con un crecimiento interanual del 132%, ¡coronándose como la compañía de modelos de IA de mayor escala de ingresos en el país!

Mientras toda la industria de modelos de IA se hunde en la guerra de precios y en el “cambio de escala” quemando dinero, Zhipu, recién listada, con este primer informe financiero, se puede decir que se ha abierto un camino totalmente opuesto.

Ve directamente algunas series de datos clave:

  • ARR de la plataforma MaaS API de ~17000 millones de yuanes; en los últimos 12 meses, subió 60 veces

  • Tras subir el precio en contra de la corriente un 83%, el volumen de llamadas de tokens no solo no cayó, sino que siguió aumentando

  • El margen bruto aumentó casi 5 veces hasta el 18.9%; el margen bruto integral anual de la empresa fue del 41%, rompiendo la maldición de la industria de la IA de “aumentar ingresos pero no ganancias”

Casi cada cifra está rompiendo, y de hecho rompiendo, las ideas preconcebidas del sector.

Antes, Zhipu era llamada por el exterior la “OpenAI versión China”; hoy, en su modelo de negocio, está cada vez más lejos de OpenAI, pero cada vez más parecida a Anthropic.

Este informe financiero demuestra que el final comercial de los modelos grandes nunca consiste en quién es más barato, sino en quién puede crear un valor más alto.

Como dijo el CEO de Zhipu, Zhang Peng, en la llamada telefónica recién celebrada:

Desde que Zhipu se fundó en 2019, hemos mantenido como único objetivo estratégico “hacer que las máquinas piensen como los humanos”. Durante seis años, este objetivo no se ha movido. También atravesamos cuestionamientos y reveses, pero incontables hechos han verificado una conclusión una y otra vez: la mejora del límite de la inteligencia, en la era de la AGI, es el único “principio fundamental” de los modelos de lenguaje.

Sobre este primer principio, también comprendemos que el vehículo para hacer la inteligencia accesible para el público general es Token. Cada persona y cada organización puede generar valor mediante la llamada a la inteligencia a través de Token. Por lo tanto, el valor comercial en la era de la AGI puede resumirse en una fórmula sencilla: límite de la inteligencia × escala de consumo de Token. El límite de la inteligencia determina el poder de fijación de precios, y la escala de consumo de Token determina la magnitud del valor.

Cómo se ejecuta una compañía china de modelos de IA: mira a Zhipu

Para entender el peso de este informe financiero de Zhipu, primero hay que ver la situación de supervivencia actual de la industria china de modelos de IA.

Desde mediados de 2024 hasta hoy, la guerra de precios sin duda se ha convertido en el terreno por el que todos los jugadores en el sector de modelos de IA luchan a muerte.

1 centavo por 1 millón de Tokens, llamadas “para siempre” como contraseña para atraer tráfico; los jugadores cambian precio por volumen, cayendo en un ciclo mortal: cuanto más bajan el precio, menos ganancias hay, menos capacidad para invertir en I+D técnica, y más difícil es mejorar el modelo.

Esta es la situación de pérdidas que toda la industria difícilmente puede evitar.

Según datos de investigación, en 2024 el margen bruto promedio de la industria china de modelos de IA fue del -80%, totalmente en fase de inversión pura; en 2025 el margen bruto promedio de la industria sigue siendo -30%, y la gran mayoría de los jugadores aún depende de quemar dinero para sostener el crecimiento de la escala.

La guerra de precios solo trae una prosperidad falsa de llamadas, pero no un ciclo comercial sano——

Cuanto más se baja el precio, menos dinero hay para invertir en investigación y desarrollo; el rendimiento del modelo es cada vez más difícil de mejorar; al final, solo queda caer en un ciclo maligno de “retener a clientes de bajo valor y alta sensibilidad al precio usando precios bajos”.

Los que van contra la guerra de precios

Justo cuando toda la industria está comparando quién tiene el precio más bajo, Zhipu tomó, al revés, una decisión que sorprendió a todos: subir el precio.

En marzo de 2026, Zhipu lanzó el modelo GLM-5-Turbo y, al mismo tiempo, ajustó al alza los precios del API. El incremento promedio frente a la generación anterior GLM-4.7 alcanzó el 83%. En un contexto donde toda la industria baja precios, tal alza tan grande fue considerada durante un tiempo por el exterior como “cortarse el camino”.

Pero el resultado final abofeteó a todos los que dudaban: después de subir precios, el volumen de llamadas de tokens de Zhipu no solo no disminuyó, sino que siguió subiendo de forma sostenida.

En las 24 horas posteriores al lanzamiento de GLM-5, obtuvo integraciones oficiales de productos de plataformas líderes como TRAE/Coze de ByteDance, Qoder de Alibaba, CodeBuddy de Tencent, CatPaw de Meituan, WanQing de Kuaishou, Baidu Intelligent Cloud y WPS Office, entre otras.

Entre las 10 principales compañías de Internet de China, 9 se convirtieron en clientes pagadores de Zhipu.

La lógica detrás de esto es en realidad muy simple: para clientes empresariales con necesidades reales a nivel productivo, el precio nunca es la primera consideración; lo que importa es el efecto.

Un modelo que pueda completar de manera estable tareas complejas, que no falle, y que realmente reduzca costos y mejore la eficiencia, incluso si cuesta un poco más, vale mucho más que un modelo barato pero que se “cae” con frecuencia.

Como dijo un desarrollador en la comunidad:

Usamos los grandes modelos para ejecutar negocio de producción. Un solo error puede causar pérdidas de decenas de miles e incluso decenas de miles de pérdidas. En lugar de estar preocupado para ahorrar un poco de dinero en Tokens, mejor gastar un poco más y usar un modelo confiable.

Zhipu validó con esta subida de precios una conclusión central: el límite de la inteligencia determina el poder de fijación de precios; la escala de consumo de Token determina el tamaño del valor.

Cuando el rendimiento de tu modelo es lo suficientemente fuerte como para resolver realmente los problemas centrales del cliente, tienes la base para fijar precios, y no te ves obligado a sumergirte en una guerra de precios interminable.

El volante de MaaS ya está girando

Muchos todavía tienen la percepción de que Zhipu solo está en la etapa de obtener ingresos haciendo servicios de modelos grandes para empresas.

Pero este informe financiero rompe por completo ese estereotipo: los ingresos del MaaS API estandarizado ya se han convertido en el motor absoluto del crecimiento principal de Zhipu; el volante del modelo de negocio MaaS, ya funciona plenamente.

¿Qué es MaaS? Model as a Service, “modelo como servicio”.

En pocas palabras, se trata de encapsular las capacidades del modelo grande en una interfaz API estandarizada. Las empresas y los desarrolladores pagan según el volumen de llamadas. No necesitan desplegar ni operar el modelo por su cuenta para poder usar directamente las capacidades del modelo grande más top.

Este es precisamente el camino comercial que Anthropic ha logrado.

Como el competidor más central de OpenAI, Anthropic desde su creación decidió seguir firmemente la ruta de “modelo base + servicio de API”. Más del 80% de sus ingresos provienen de las llamadas a API por parte de empresas y desarrolladores.

En 2025, los ingresos anuales de Anthropic alcanzaron 4500 millones de dólares, un salto de 12 veces frente a 2024. A finales de año, el ARR superó además los 9000 millones de dólares. El margen bruto pasó de -94% en 2024 a un 40% ampliamente positivo. Todo respaldado por resultados sólidos, demostrando la viabilidad del modelo MaaS.

Y Zhipu está recorriendo un camino altamente consistente con el de Anthropic: tomando como principal fortaleza el límite de inteligencia del modelo; usando como forma principal de producto el Token; y como motor de crecimiento el uso profundo por parte de desarrolladores y clientes a nivel empresarial.

El núcleo del crecimiento no depende de proyectos de personalización únicos, sino de que la inteligencia del modelo sea realmente usada por las empresas y los desarrolladores, llevada a la etapa de producción, y se convierta en ingresos sostenibles y escalables.

Los datos de este informe financiero también corroboran de forma indirecta el funcionamiento de este volante:

  • El ARR de la plataforma MaaS API, en el último año, logró ~17000 millones de yuanes; en los últimos 12 meses aumentó 60 veces;

  • La plataforma ya ha servido a 4 millones de usuarios empresariales y desarrolladores, y atiende a más de 218 países y regiones en el mundo;

  • Zhipu ya se ha convertido en uno de los fabricantes con mayor volumen de consumo de Tokens pagados en China; el “núcleo” en escenarios de Coding se mantiene sólido; y la explosión de aplicaciones como OpenClaw también abre un espacio completamente nuevo para el consumo de escala de Tokens.

La lógica de este volante, en realidad, es un ciclo positivo perfecto: cuanto mejor sea el rendimiento del modelo, más atraerá a clientes empresariales de alto valor; las llamadas profundas de clientes de alto valor generan ingresos y utilidades estables; y más ingresos se pueden reinvertir en investigación y desarrollo técnico, elevando aún más el rendimiento del modelo.

Cambiar tecnología por ganancias

El modelo MaaS es un negocio donde el costo marginal baja de forma continua y donde las economías de escala son extremadamente fuertes.

El modelo solo necesita entrenarse y optimizarse una vez para servir a millones de clientes en todo el mundo. Cuantas más llamadas haya, menor será el costo por Token y mayor será el margen bruto.

Por eso Zhipu puede lograr en este informe financiero una mejora de margen bruto de forma exponencial. El informe muestra que el margen bruto de la plataforma MaaS API de Zhipu aumentó 5 veces frente al año anterior. El margen bruto integral del año se dio vuelta de forma pronunciada, muy por encima del nivel promedio de la industria.

Los principales impulsores de la mejora de la rentabilidad provienen de tres aspectos:

  • Primero, optimización extrema de la eficiencia de inferencia del modelo: mediante innovación en la arquitectura y optimización de ingeniería, se reduce el costo de inferencia por Token hasta niveles bajos en la industria;

  • Segundo, aumento sostenido en la proporción de clientes de alto valor: la tasa de retención y la profundidad de llamadas de estos clientes están muy por encima del promedio de la industria;

  • Tercero, efecto de selección positiva generado por la subida de precios: precios más altos filtran a clientes que valoran más el rendimiento y tienen mayor capacidad de pago; el valor comercial de estos clientes es mucho mayor que el de los clientes de bajo valor sensibles al precio.

Lo más importante es que, con el fuerte impulso de crecimiento actual del negocio MaaS; esto significa que el volante de MaaS de Zhipu no solo ya se ha puesto en marcha, sino que sigue acelerándose.

Del laboratorio de Tsinghua al grupo élite #1 global

Que Zhipu haya podido subir precios contra la guerra de precios, hacer funcionar el volante de MaaS, y que su base de soporte a nivel profundo venga de la realidad técnica, en ningún caso se basa en marketing y operaciones, sino en capacidad técnica sólida.

Muchos saben que el punto de partida de Zhipu es el equipo técnico de la Universidad de Tsinghua. Desde su fundación, Zhipu no tomó la ruta de arquitectura “puramente GPT-style de autoregresión” que seguía la tendencia del sector; en cambio, mantuvo la originalidad y desarrolló una arquitectura única que combina codificación bidireccional GLM + fusión autoregresiva. Desde el origen, ya tenía ventajas innatas: comprensión de textos largos, baja alucinación y lógica fuerte, sentando una base sólida para iteraciones técnicas posteriores.

En 2022, Zhipu abrió el código del modelo GLM-130B con mil millones de parámetros, convirtiéndose en el único producto de Asia seleccionado para las evaluaciones globales de modelos de lenguaje principales de Stanford; además, mediante técnicas de cuantización, logró un funcionamiento fluido en GPUs de consumo, consolidando de una vez la posición central del ecosistema doméstico de modelos grandes de código abierto.

Desde entonces, Zhipu ha grabado “I+D técnica propia” en lo más profundo. Ha completado la autonomía y control de tecnologías centrales en toda la cadena, logrado la adaptación de extremo a extremo de chips domésticos, y ha reforzado desde la base las raíces de seguridad técnica y optimización de costos.

En la industria de modelos de IA, hay una verdad inquebrantable: el techo de la comercialización lo determina siempre el límite de capacidad del modelo.

Anthropic puede lograr un crecimiento de ingresos de 12 veces en un año; el núcleo es que las capacidades de los modelos de la serie Claude siguen acercándose e incluso superando en parte a GPT. Y Zhipu puede ocupar la primera posición de ingresos dentro de la industria de modelos grandes en China; el núcleo también es la capacidad de la serie GLM, que ya está firmemente en el primer grupo a nivel global.

El año pasado, Zhipu completó una rápida iteración desde GLM-4.5 hasta GLM-4.6 y GLM-4.7, y luego hasta GLM-5 y GLM-5-Turbo, manteniendo el ritmo de élite de la industria: una actualización del modelo base cada 1-2 meses.

Más importante aún, Zhipu completó una transformación fundamental de “orientado al conocimiento” a “orientado a tareas”, haciendo que GLM se convirtiera en un agente inteligente capaz de completar tareas complejas de manera independiente.

El núcleo de esa transformación es el avance en la capacidad de AI Coding.

Para los modelos de IA, la capacidad de programación es la base de todas las capacidades para tareas complejas: saber escribir bien código significa que el modelo tiene fuerte lógica, fuerte planificación y fuerte capacidad de invocación de herramientas; puede descomponer las necesidades complejas en pasos ejecutables y, al final, entregar resultados que se puedan llevar a la práctica.

Y el escenario de Coding también es, actualmente, el más maduro para la comercialización de modelos grandes y el que tiene la mayor intención de pago. El 70%-75% de los ingresos de Anthropic provienen de llamadas relacionadas con la generación de código.

Zhipu captó con precisión este “núcleo” principal.

El modelo GLM-5, publicado en febrero de 2026, además logró una actualización de salto desde Vibe Coding hasta Agentic Engineering.

En benchmarks globales autorizados de programación, GLM-5 obtuvo 77.8 puntos en SWE-bench-Verified y 56.2 puntos en Terminal Bench2.0; se mantiene firmemente en la primera posición entre los modelos de código abierto. La experiencia de uso real ya se acerca al modelo insignia de Anthropic, Claude Opus 4.5.

En la lista global autorizada de Artificial Analysis, GLM-5 está en el puesto 4 a nivel mundial y el 1 entre los de código abierto, solo detrás de GPT, Claude y Gemini. Se coloca firmemente en el grupo élite de la IA global.

Lo que aún es más digno de esperar es que Zhipu también está a punto de lanzar GLM-5.1.

Además, propone la fuerza de arquitectura Token (TAC)

Este informe financiero no es solo la primera hoja de resultados de Zhipu tras su salida a bolsa, sino también una reestructuración integral de Zhipu. Con datos reales y concretos, hace que toda la industria vuelva a reconocer a Zhipu y redefine los criterios para medir el valor de los modelos grandes.

En los últimos años, toda la industria de modelos grandes ha caído en un gran malentendido: todos compiten por quién tiene más parámetros, quién tiene puntuaciones de benchmarks más altas y quién tiene un precio más bajo, pero muy pocos se detienen a pensar cuál es el valor central de un modelo grande.

Aunque el benchmark sea altísimo, si no se puede llevar a escenarios reales y no ayuda a empresas y personas a crear valor económico real en dinero, entonces no tiene sentido.

Precisamente con base en este juicio, en este informe financiero Zhipu propone por primera vez el concepto de Token Architect Capability (Token Architect Capability, abreviado TAC) y presenta un marco tridimensional cuantificable del valor de la IA:

TAC = cantidad de inteligencia en las llamadas × calidad de la inteligencia × eficiencia de conversión en valor económico

  • Cantidad: cuántos Tokens están dispuestos a llamar diariamente las empresas y las personas, y cuántas tareas, y de qué magnitud, están dispuestas a encomendarle a la IA para que las procese;

  • Calidad: si esos Tokens provienen de modelos lo suficientemente inteligentes y confiables, y si pueden entregar resultados estables en tareas complejas;

  • Eficiencia: si las tareas procesadas por esa IA pueden realmente convertirse en producción económica medible, logrando reducción de costos y mejora de eficiencia de manera tangible.

Zhipu cree que en el futuro, la competitividad central de organizaciones e individuos dependerá cada vez más de su nivel de TAC.

Y lo que Zhipu quiere hacer no es solo ser una empresa de modelos que vende Tokens, sino ser la infraestructura que mejora la capacidad TAC de toda la sociedad, ofreciendo a cada empresa, a cada desarrollador y a cada individuo una base de capacidades para transformar inteligencia en resultados económicos que se puedan entregar.

El hecho de proponer este concepto marca que la industria china de modelos grandes ha entrado oficialmente en una nueva etapa de competencia de arquitectura inteligente, pasando de la “competencia de parámetros”, de la “involución por benchmarks” y de la “guerra de precios”.

Antes, al evaluar una compañía de modelos grandes, mirábamos cuántos parámetros tenía y cuánta financiación conseguía. En el futuro, evaluaremos una compañía de modelos grandes por cuánto TAC puede ayudar a sus clientes a mejorar, y por cuánta inteligencia puede convertir en valor económico real.

Y el informe financiero de Zhipu es la mejor nota al pie del mejor ejemplo de esta nueva era.

Cuando toda la industria depende de quemar dinero para cambiar la escala y de precios bajos para cambiar el tráfico, Zhipu ya ha salido de un ciclo comercial sano de “avance tecnológico → liderazgo en resultados → poder de fijación de precios → ingresos escalables → ganancias → reinversión en tecnología”.

Este informe financiero demuestra que los modelos grandes son un buen negocio que puede crear valor de verdad y generar rentabilidad; que los fabricantes chinos de modelos grandes también pueden abrir un camino propio, enfrentándose en el mismo escenario que los jugadores líderes globales.

En la segunda mitad de la industria china de modelos grandes, por fin, se vuelve desde el bullicio de la guerra de precios al camino correcto de tecnología y comercio.

Fuente del artículo: Quantum Bit

Aviso de riesgos y cláusulas de exención de responsabilidad

        Hay riesgos en el mercado; invierte con cautela. Este artículo no constituye asesoramiento de inversión personal, y tampoco considera objetivos de inversión especiales, situación financiera o necesidades específicas de usuarios individuales. Los usuarios deben considerar si cualquiera de las opiniones, puntos de vista o conclusiones contenidas en este artículo es coherente con su situación específica. Invierte bajo tu propia responsabilidad.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado