Básico
Spot
Opera con criptomonedas libremente
Margen
Multiplica tus beneficios con el apalancamiento
Convertir e Inversión automática
0 Fees
Opera cualquier volumen sin tarifas ni deslizamiento
ETF
Obtén exposición a posiciones apalancadas de forma sencilla
Trading premercado
Opera nuevos tokens antes de su listado
Contrato
Accede a cientos de contratos perpetuos
TradFi
Oro
Plataforma global de activos tradicionales
Opciones
Hot
Opera con opciones estándar al estilo europeo
Cuenta unificada
Maximiza la eficacia de tu capital
Trading de prueba
Introducción al trading de futuros
Prepárate para operar con futuros
Eventos de futuros
Únete a eventos para ganar recompensas
Trading de prueba
Usa fondos virtuales para probar el trading sin asumir riesgos
Lanzamiento
CandyDrop
Acumula golosinas para ganar airdrops
Launchpool
Staking rápido, ¡gana nuevos tokens con potencial!
HODLer Airdrop
Holdea GT y consigue airdrops enormes gratis
Pre-IPOs
Accede al acceso completo a las OPV de acciones globales
Puntos Alpha
Opera activos on-chain y recibe airdrops
Puntos de futuros
Gana puntos de futuros y reclama recompensas de airdrop
Inversión
Simple Earn
Genera intereses con los tokens inactivos
Inversión automática
Invierte automáticamente de forma regular
Inversión dual
Aprovecha la volatilidad del mercado
Staking flexible
Gana recompensas con el staking flexible
Préstamo de criptomonedas
0 Fees
Usa tu cripto como garantía y pide otra en préstamo
Centro de préstamos
Centro de préstamos integral
Centro de patrimonio VIP
Planes de aumento patrimonial prémium
Gestión patrimonial privada
Asignación de activos prémium
Quant Fund
Estrategias cuantitativas de alto nivel
Staking
Haz staking de criptomonedas para ganar en productos PoS
Apalancamiento inteligente
Apalancamiento sin liquidación
Acuñación de GUSD
Acuña GUSD y gana rentabilidad de RWA
¿Se ha concretado la venta de API por parte de Zhipu tras un aumento del 31.8%?
Por / Arqi
Ayer, Zhipu anunció sus resultados financieros de todo 2025, que también constituyen su primer informe tras su salida a bolsa.
Durante todo el año, logró ingresos de 7,24 mil millones de yuanes, con un crecimiento interanual del 131,9%; pero, impulsada por 31,8 mil millones de yuanes en I+D, la pérdida neta ajustada alcanzó 31,82 mil millones de yuanes.
Aunque se perdió tanto dinero, la respuesta del mercado fue muy positiva. Hoy, la cotización de Zhipu subió un 31,8%.
Entre las razones, una muy importante es que el asunto de vender API parece, por fin, haberse puesto en marcha.
En 2025, los ingresos por vender API pasaron de 0,48 mil millones de yuanes en 2024 a 1,9 mil millones de yuanes, con un crecimiento del 296%. Al mismo tiempo, en la conferencia telefónica, la dirección de Zhipu mencionó con claridad que, actualmente, el ARR del servicio de API es de aproximadamente 2,5 mil millones de dólares y que se espera que para finales de año alcance los 1.000 millones de dólares.
Y más importante aún, esto no es un caso aislado. En otras empresas de grandes modelos, también hemos ido viendo gradualmente tendencias similares: el volumen de llamadas a Token va en aumento y la API se está convirtiendo en una de las vías de monetización más directas.
Entonces, ¿cómo deberíamos ver este fenómeno? Hoy, vamos a hablar de ello, combinándolo con el informe financiero de Zhipu.
/ 01 /
Crecimiento del modelo base: respaldado por la venta de API
En el informe financiero de Zhipu, el cambio más digno de atención es la migración de la estructura de ingresos.
La implementación en la nube se ha convertido en la fuente de crecimiento más central. Lo que se llama implementación en la nube, en esencia, es el servicio de API. En 2025, esta parte de los ingresos pasó de 0,48 mil millones de yuanes en 2024 a 1,9 mil millones de yuanes, con un crecimiento del 296%; además, la proporción de ingresos también subió del 15,5% al 26,3%.
El crecimiento de la API tiene como lógica central el aumento del volumen de llamadas.
Y detrás de esto no puede faltar el impulso de OpenClaw. Cuando el Agent empieza a ejecutar tareas de forma automática, una sola demanda suele corresponder a múltiples rondas de llamadas; el consumo de Token se multiplica y, en consecuencia, el volumen de llamadas a la API también aumenta.
Con el tiempo, se va formando un consenso en la industria: cuando los grandes modelos cuentan con la capacidad de ejecutar tareas de largo alcance, las llamadas dejan de quedarse en un ciclo único de entrada y salida, y evolucionan hacia un proceso sistemático y continuamente ejecutable.
Bajo esta estructura, el propio Token se convierte en la unidad de cobro más directa y, además, la más segura.
Dicho de otra manera, cuando la capacidad del modelo es suficientemente fuerte, la propia API acaba convirtiéndose en el modelo de negocio comercial más claro de los grandes modelos.
Esta tendencia se está convirtiendo en una elección común de las empresas de grandes modelos.
En el extranjero se avanzó más temprano. Aproximadamente el 80% de los ingresos de Anthropic provienen de los servicios de llamadas a API a nivel empresarial; en esencia, es un sistema de cobro basado en el consumo de Token.
En el país también se está acercando rápidamente a esta estructura.
Actualmente, en China, las empresas principales de modelos base, como Zhipu AI, MiniMax y la empresa de la cara oculta de la luna, están migrando gradualmente sus ingresos principales hacia las llamadas a API, y MaaS (Model as a Service) se está convirtiendo en la principal vía para impulsar el crecimiento.
En la conferencia telefónica, la dirección de Zhipu mencionó de forma explícita que, actualmente, el ARR del servicio de API es de aproximadamente 2,5 mil millones de dólares y que se espera que para finales de año alcance los 1.000 millones de dólares. En el futuro, la empresa también dará aún más prioridad a los servicios de API estandarizados. Para 2026, se prevé que el servicio de API y la implementación localizada se repartan al 50% cada uno; y, en los próximos 2-3 años, el foco se inclinará aún más hacia la API.
Cambios similares también están ocurriendo en MiniMax.
En 2025, los ingresos de su plataforma abierta y servicios empresariales alcanzaron 25,963 millones de dólares, con un crecimiento del 197,8%; la proporción de ingresos subió del 28,6% al 32,8%.
A 2 de febrero de 2026, el ARR de la empresa ya superó los 1,5 mil millones de dólares; en comparación con los 7900 millones de dólares del año fiscal 2025, el crecimiento equivale al doble. El impulso central del crecimiento, al igual que antes, proviene del aumento del consumo de Token, especialmente por la expansión de los escenarios de asistentes de codificación y de agentes (Agent).
Goldman Sachs estima que, en 2026, la proporción de ingresos de MiniMax provenientes de la plataforma abierta (API) alcanzará aproximadamente el 40%.
La convergencia del modelo de negocio de los grandes modelos implica que la manera de medir el valor también se vuelve más clara: pasar de los “indicadores de capacidad” a la “medición por Token”.
/ 02 /
Detrás de la división de rutas: dos enfoques para resolver el problema
A medida que la IA entra en la fase de aplicaciones, un problema empieza a volverse concreto: cuando las capacidades del modelo convergen gradualmente, ¿cuál es la competencia central de los grandes modelos?
Sobre este tema, Zhipu y MiniMax ofrecen dos soluciones diferentes.
La lógica de Zhipu es perseguir el límite máximo del modelo con todo.
Zhang Peng propuso el concepto de TAC (Token Architecture Capability, capacidad de arquitectura de Token); en esencia, puede descomponerse en tres puntos: escala de llamadas, calidad de las llamadas y capacidad de convertirlo en ingresos.
Su juicio central es: la calidad de la inteligencia determina el poder de fijación de precios.
El juicio de Zhipu es: “A medida que evolucionan los Agent, Token se estratificará: los tokens de baja complejidad y estandarizados se dirigirán hacia precios bajos e incluso gratuitos; solo los tokens de alta complejidad y alta confiabilidad, de alta calidad, tendrán un poder de fijación de precios continuo”.
Este punto ya se ha reflejado en los datos. En el primer trimestre, el precio de la API de Zhipu aumentó un 83%, pero la demanda no se contrajo; al contrario, mostró una situación de exceso de demanda, con un crecimiento del volumen de llamadas del 400%.
Si Zhipu AI está hablando de “la calidad que determina el poder de fijación de precios”, entonces MiniMax, en realidad, está hablando de otra lógica: la competitividad del modelo proviene de la “diferenciación del camino” y la “eficiencia”.
MiniMax eligió una ruta que no es la más común: el desarrollo en paralelo de un modelo multimodal en cuatro modalidades principales—texto, video, voz y música—mediante I+D propia de extremo a extremo. En el mercado actual de fabricantes de grandes modelos, esto no es frecuente.
El núcleo de esta ruta no está en “tener más”, sino en “ser más amplio”.
Según Yan Junjie, el valor de una empresa de plataforma en la era de la IA es, en esencia: densidad de inteligencia × capacidad de procesamiento de Token.
El significado del multimodal es que, sin reducir de forma significativa la densidad de inteligencia, amplifica la capacidad de procesamiento de Token. Porque lo que cambia no es el límite de capacidad, sino el umbral de uso.
Cuando en el producto se incorporan formas de interacción como imágenes y voz, bajan de manera evidente el costo de comprensión del usuario y el umbral de operación; la base de usuarios también se amplía hacia un público más amplio, incluyendo personas mayores, niños, etc., que antes eran difíciles de abarcar.
Esto, en realidad, ya ha ocurrido en el internet móvil: del flujo de información con imágenes y texto al estallido de los videos cortos; en esencia, todo se logra mediante la reducción del umbral de interacción, para provocar un salto en la penetración.
Veamos ahora la eficiencia. La otra línea principal de MiniMax es la eficiencia extrema en el uso de recursos.
En 2025, la empresa destinó 2,53 mil millones de dólares a I+D, con un crecimiento del 33,8%, claramente inferior al ritmo de crecimiento de los ingresos del 158,9%.
En comparación, la estrategia de Zhipu AI es más parecida a “ir con fuerza y apostar por ganar con fuerza”.
En 2025, los ingresos de Zhipu fueron 7,24 mil millones de yuanes, lo que corresponde a 31,8 mil millones de yuanes en gastos de I+D; la tasa de gastos de I+D llegó al 439%. En el mismo período, los ingresos de MiniMax fueron 5,4 mil millones de yuanes, los gastos de I+D fueron 17,43 mil millones de yuanes y la tasa de gastos de I+D fue 323%.
En eficiencia operativa, por cada 1 yuan de ingresos que obtiene Zhipu, corresponde una pérdida de aproximadamente 4,4 yuanes; MiniMax es de 3,2. En eficiencia de personal, Zhipu tiene aproximadamente 660.000 (personas equivalentes) y MiniMax alcanza 126 (personas equivalentes).
Por supuesto, una parte de estas diferencias proviene del modelo de negocio: MiniMax depende más de los ingresos del producto, mientras que Zhipu sigue priorizando principalmente la implementación localizada.
Pero incluso así, la división entre ambas rutas sigue siendo clara:
Por un lado, se persigue el “máximo límite de inteligencia” para obtener poder de fijación de precios incrementando la capacidad;
Por el otro, se optimiza la “eficiencia y cobertura”, ampliando el tamaño de uso para amplificar la capacidad de procesamiento de Token.
En esencia, bajo la misma fórmula, hay dos soluciones completamente distintas.
/ 03 /
El oligopolio: la mayor certeza del negocio de los modelos base
Dejando de lado la valoración, este negocio de los fabricantes de modelos ya empieza a mostrar un contorno relativamente claro.
El negocio de los modelos base no es como el software tradicional.
El software tradicional implica una inversión alta al inicio, pero luego se recupera lentamente; sin embargo, los modelos base son distintos: sus costos aumentan de manera escalonada, mientras que los ingresos tal vez no se vuelvan igual de “gruesos” en paralelo, e incluso podrían seguir siendo comprimidos continuamente a medida que la competencia se intensifica.
Visto desde este ángulo, es más parecido a una estructura “intrínsecamente frágil”. Pero lo interesante es que esta misma estructura apunta a otro resultado:
Que naturalmente conduce a un oligopolio.
Porque solo muy pocas empresas pueden sostener de forma continua este nivel de inversión. En cuanto a la forma de negocio, se parece más a una batería o a una fábrica de obleas: la inversión inicial es enorme, pero una vez que logras posicionarte, hay muy pocos competidores y el tamaño del “pastel” es lo suficientemente grande.
Al mismo tiempo, los grandes modelos tienen un punto aún más sutil: no se trata por completo de un mercado “el ganador se lo lleva todo”, sino más bien de un mercado segmentado.
En el nivel más alto del modelo, aunque la ventaja de efectividad sea solo del 5%, en escenarios complejos orientados a la eficiencia como el coding, esa ventaja se amplifica hasta convertirse en una prima de más del 50%, gracias al efecto multiplicador.
Pero al mismo tiempo, no todas las tareas requieren el modelo más fuerte.
Así, el mercado se segmenta de manera natural: el nivel superior se queda con la prima, el nivel medio escala en volumen y el nivel inferior atiende la demanda de la “cola larga”. Incluso entre distintos niveles se formará algún tipo de “flujo de Token”: tareas complejas hacia arriba y tareas simples hacia abajo.
Incluso si no puedes lograr el SOTA a nivel global, lograr SOTA en algún subcampo sigue siendo una ruta válida.
Y en esta estructura, la eficiencia también es una variable muy clave.
Porque en esta industria casi no hay efectos de red y el costo de cambio del usuario es extremadamente bajo. Esto significa que, siempre que exista una empresa capaz de producir un modelo “de 90 puntos” y además con un precio más bajo, puede escalar rápidamente en volumen.
En ese proceso, la eficiencia también se convierte en una variable importante para la comercialización.
Como no hay efectos de red y el costo de cambio es bajo, con que una empresa pueda hacer un modelo “de 90 puntos” y, al mismo tiempo, con un precio menor, también puede crecer rápidamente en volumen.
La razón es bastante directa: en algunos escenarios, no se necesita el modelo más fuerte. Cuando la diferencia de rendimiento es limitada, el precio se convierte en el factor decisivo.
Y detrás del precio, la esencia es el costo. Esto no solo depende de la tecnología, sino también de diferencias en una serie de costos como el poder de cómputo y la electricidad.
Tomando China como ejemplo: mediante optimización de ingeniería, despliegue a escala y costos de electricidad más bajos, se puede reducir de forma significativa el costo de inferencia. Esto hace que, con modelos de capacidad equivalente, se pueda ofrecer el servicio de Token a un precio más bajo.
Actualmente, parte de la salida al exterior de algunas empresas chinas de modelos, en esencia, es un negocio de “diferencia de precio de Token”.
Ciertamente, el crecimiento de ingresos proviene de una demanda explosiva y del patrón oligopólico del mercado; sin embargo, tampoco se debe ser demasiado optimista, porque debido a las diferencias del entorno competitivo, China y EE. UU. todavía tienen muchas diferencias al vender API, por ejemplo:
En EE. UU., el ecosistema de grandes modelos depende más de la demanda de la cola larga de desarrolladores; los clientes empresariales y los desarrolladores están más dispuestos a pagar por capacidad, y el rendimiento del modelo se puede convertir de forma más fácil y directa en prima.
Mientras tanto, en el mercado nacional, las llamadas se concentran más en clientes de primera línea, incluidos plataformas de internet y clientes gubernamentales/empresariales; además, con la competencia en el lado de la oferta, la prima por Token probablemente no existirá a largo plazo.
En cierto sentido, en EE. UU. los modelos base se parecen más a la combinación de software y plataforma, mientras que en China se parecen más a una parte de la infraestructura.
Desde este ángulo, hasta qué punto puede llegar el modelo de negocio de las empresas nacionales de grandes modelos, probablemente todavía habrá que seguir observándolo.