Economía de fábricas de tokens, que está reconstruyendo toda la industria de la IA

Autor: Haishan

Desde la “guerra de precios” de tokens en 2024, hasta el aumento colectivo de precios de Alibaba Cloud, Tencent Cloud y Baidu Cloud en 2026.

La industria de tokens en solo dos años completó una asombrosa reversión, pasando de gastar mucho dinero en competencia interna y exceso de capacidad a una demanda insatisfecha y aumento simultáneo de volumen y precio.

Desde 2026, el sector de IA en las acciones A ha registrado un aumento acumulado superior al 55%, empresas líderes como Moonshot AI y Zhitu AI han superado los 1,000 millones de yuanes en ingresos mensuales, y algunas empresas han superado en 20 días los ingresos totales de 2025.

Esta revolución industrial, definida por Huang Renxun como la “economía de fábricas de tokens”, ha superado ya la mera especulación técnica, convirtiéndose en una tendencia de certeza impulsada por la explosión de demanda real, desequilibrios en la oferta y demanda, y la competencia global en energía y poder de cálculo. La reestructuración de su lógica subyacente está redefiniendo las reglas del juego en toda la industria de IA y también está subvirtiendo la lógica fundamental del funcionamiento del mundo.

01 “Petróleo” en la nueva era

La esencia de este punto de inflexión industrial es que la industria de IA ha pasado de una “carrera armamentística de modelos” a una “carrera por la capacidad de producción de tokens”.

Antes de 2024, la narrativa central era “quién tiene el modelo con más parámetros y quién es más inteligente”, con grandes empresas quemando dinero en entrenamiento de grandes modelos, ofreciendo tokens gratis o vendiéndolos a bajo precio para ganar mercado, incluso llegando a una situación anómala donde “vender tokens no es tan rentable como vender agua mineral”.

Pero en febrero de 2026, la explosión de popularidad del agente inteligente OpenClaw (conocido como “Langosta”) rompió por completo esa lógica.

Los grandes modelos tradicionales son “búsqueda de IA por parte del humano”, con interacciones de una sola ronda que consumen solo 1000-3000 tokens. En cambio, los agentes usan un ciclo de “planificación-acción-observación-reflexión”, donde resolver tareas complejas requiere decenas o cientos de llamadas al modelo, consumiendo 100,000 tokens en tareas medianas y millones en tareas complejas, siendo conocidos en la industria como “trituradores de tokens”.

Los datos del Buró Nacional de Estadísticas confirman esta explosión: el uso diario de tokens en China pasó de 100 mil millones a principios de 2024 a 140 billones en marzo de 2026, un crecimiento de más de 1000 veces en dos años, con un aumento del 40% solo en el primer trimestre de 2026 respecto a finales de 2025.

La narrativa de la industria cambió radicalmente: ya no se compite por el “límite de inteligencia” del modelo, sino por quién puede producir en masa tokens a menor costo y con mayor estabilidad, y quién controla la oferta inteligente.

Frente a una demanda masiva, la rigidez en la desajustada oferta y demanda es el principal soporte para la tendencia alcista de los tokens, y esta desbalance no es una fluctuación a corto plazo, sino una contradicción estructural determinada por el ciclo largo de la cadena industrial.

Existen tres obstáculos insuperables en la oferta: primero, la capacidad de hardware clave está monopolizada y la expansión lleva mucho tiempo.

La memoria de alta banda ancha HBM es el “corazón” de los servidores de IA, con Samsung, SK Hynix y Micron controlando más del 95% de la capacidad global. La expansión tarda entre 24 y 36 meses, causando un déficit de más del 40% en HBM en 2026.

Como resultado, la memoria DDR5 normal subió un 300% en medio año, y el precio de una memoria de 256G para servidores superó los 40,000 yuanes. El ciclo de entrega de servidores de IA se extendió de 3 a 12 meses.

En segundo lugar, la electricidad y la energía se han convertido en los mayores cuellos de botella ocultos. Los armarios de centros de cálculo inteligente consumen entre 10 y 20 veces más energía que los centros de datos tradicionales, y el costo eléctrico representa más del 60% del costo de producción de tokens. La construcción de infraestructura eléctrica en grandes centros de datos lleva de 3 a 5 años, y en el este de China ya hay una escasez de capacidad de cálculo.

En tercer lugar, la infraestructura y la capacidad de operación y mantenimiento no siguen el ritmo de la explosión de demanda. La penetración de centros de datos con enfriamiento líquido pasó del 15% en 2024 al 45% en 2026, pero la escasez de talento técnico y capacidad de construcción limita la operación eficiente de muchas instalaciones existentes.

La capacidad en la oferta es insuficiente, mientras que la demanda presenta una explosión en “tres etapas”, con un crecimiento muy sostenido.

La primera etapa es la popularización de agentes inteligentes en el consumo individual, que pasa de chat y entretenimiento a asistentes IA que gestionan correos, programan y hacen planes, con un consumo diario de tokens que pasa de decenas a miles, y se espera que en el futuro supere las decenas de miles.

La segunda etapa es la implementación completa de aplicaciones productivas en el sector empresarial, donde las empresas dejan de ver la IA solo como un complemento y la incorporan como un elemento clave de producción, con empresas como Kunlun Wanwei y 58.com consumiendo más de 1 billón de tokens al mes. La transformación de industrias como manufactura, finanzas y salud está generando una demanda de tokens de billones de yuanes.

La tercera etapa es la explosión de demanda en mercados internacionales. Los grandes modelos nacionales tienen precios de tokens solo una quinta o tercera parte de los de Claude o GPT en el extranjero, y con una relación calidad-precio muy alta, están conquistando rápidamente mercados en el sudeste asiático, Oriente Medio y América Latina. En el primer trimestre de 2026, los ingresos por tokens en el extranjero de los proveedores chinos de nube aumentaron un 320% interanual, convirtiéndose en un nuevo motor de crecimiento.

En un nivel más profundo, los tokens están convirtiéndose en la materia prima fundamental de la era de IA, reestructurando todo el sistema de valor de la economía digital. Así como la electricidad fue la energía central en la era industrial y el tráfico fue el activo clave en la era de Internet, los tokens son los medios de producción esenciales en la era inteligente, con atributos medibles, valorables y negociables, sirviendo como un punto de anclaje universal que conecta la oferta de poder de cálculo con la demanda inteligente.

Este cambio trae una revolución en los modelos de negocio: la industria abandona la vieja estrategia de “quemar dinero para escalar” del internet y entra en una nueva fase de “tarificación por uso y rentabilidad”.

Las grandes empresas generalmente adoptan una estrategia de “subsidios en la etapa C para crear hábito, y escalado en la etapa B para maximizar beneficios”: ofrecen tokens gratis por tiempo limitado a usuarios individuales, y cobran de manera precisa a las empresas según su consumo. En el primer trimestre de 2026, la rentabilidad bruta de los principales proveedores de nube en IA superó el 35%, logrando por primera vez beneficios a escala.

Para China, esta revolución de tokens representa una oportunidad histórica para adelantar a otros países. China tiene los costos de energía verde más bajos del mundo, la infraestructura de poder de cálculo más avanzada (con más del 60% de la capacidad global), los escenarios de aplicación más amplios y los modelos de mayor relación calidad-precio, con todas las condiciones para convertirse en la “fábrica mundial de tokens”.

Al igual que en el pasado, cuando China se convirtió en la “fábrica del mundo” por su ventaja en costos, ahora China, con sus ventajas en energía, capacidad y escenarios, lidera la producción y oferta global de tokens.

A corto plazo, la desajustada oferta y demanda persistirá hasta finales de 2027, manteniendo los precios altos, y la concentración del sector se acelerará.

A largo plazo, con la liberación de la capacidad de chips y la optimización de la eficiencia de los modelos, llegará una era de “tokens a precios de ganga”, penetrando en todos los rincones de la economía nacional y convirtiéndose en el motor principal del crecimiento económico digital.

02 ¿Cómo es la situación en las industrias específicas?

Con la transformación de la industria de tokens de “competencia por precios bajos” a “escasez de oferta y demanda”, las subsectores muestran una diferenciación estructural.

Se observa una tendencia diferenciada en la fijación de precios en la parte superior, en la generación de beneficios en el medio y en la monetización en la parte inferior, con barreras, ciclos de auge y lógica de distribución de valor muy distintas en cada segmento.

Primero, en hardware de capacidad de cálculo, que es la capacidad productiva central de las fábricas de tokens, domina un patrón de monopolio.

Incluye chips de IA, servidores de capacidad, enfriamiento líquido y operación de centros de cálculo inteligente, con una estructura de oligopolio.

Los chips de IA son el motor principal de la producción de tokens, con Nvidia controlando más del 90% del mercado global de GPU de alta gama.

En China, los líderes nacionales como Cambrian y Hygon están acelerando su avance: Cambrian ha logrado producción en masa de su chip Si Yuan 590, que soporta inferencia y entrenamiento de grandes modelos, con un crecimiento del 320% en ingresos de chips de IA en el primer trimestre de 2026.

Hygon, con su producto DCU, ha penetrado en más del 30% del mercado de centros de cálculo inteligentes en China, colaborando con empresas como Sugon y Inspur. La serie JM9 de Jingjia Micro se ha implementado en escenarios gubernamentales y financieros, siendo un proveedor clave de GPU nacionales.

Los servidores de capacidad son el soporte de la producción de tokens, con líderes en China controlando la mayor parte del mercado global.

Inspur mantiene la primera posición en participación de mercado en servidores de IA, con un aumento del 180% en envíos en el primer trimestre de 2026. Sugon domina el mercado nacional de servidores con enfriamiento líquido, apoyando más del 80% de los centros de cálculo nacionales.

El enfriamiento líquido es una necesidad para centros de cálculo de alta potencia, con una penetración que pasa del 15% en 2024 al 45% en 2026.

Inveric, líder en enfriamiento líquido, ha visto un aumento del 210% en pedidos en 2026, con clientes como Nvidia, Inspur y Huawei.

Shenling ha implementado soluciones de enfriamiento líquido en varios centros de cálculo nacionales, con un crecimiento de pedidos superior al 150%.

En la operación de centros de cálculo inteligente, empresas como Baoxin Software, Halo New Network y Runze Zhishuan, gracias a su ubicación estratégica y recursos de energía verde, se han convertido en los principales operadores de centros de cálculo de terceros en China, con un crecimiento de ingresos por alquiler de capacidad superior al 100% en el primer trimestre de 2026.

En la parte media, los centros de tokens, que se encargan de la gestión de precios, servicios de modelos y estandarización de tokens, están pasando de una guerra de precios a una guerra de valor.

Los principales en esta categoría en China, como Kunlun Wanwei, ya tienen una ruta clara de comercialización de tokens.

Por ejemplo, el modelo TianGong de Kunlun Wanwei tiene un consumo diario de más de 1.2 billones de tokens, con más de 120,000 clientes B2B, y su precio de servicio de tokens para empresas es solo una cuarta parte del de modelos extranjeros. Sus ingresos en IA en el primer trimestre de 2026 aumentaron un 450% interanual.

iFlytek, con su modelo Xinghuo, se enfoca en educación, salud y oficina, con el 70% del consumo de tokens proveniente de aplicaciones B2B productivas.

Los proveedores de servicios en la nube como Alibaba Cloud, Tencent Cloud y Volcán Engine, aunque no cotizan en bolsa en China, se benefician de empresas relacionadas como UFIDA y Kingdee (Hong Kong), que desarrollan aplicaciones empresariales basadas en Alibaba Cloud, siendo canales importantes de consumo de tokens.

Finalmente, en las aplicaciones en el extremo inferior, los tokens se utilizan en el consumo final de los usuarios y en servicios empresariales, penetrando en sectores verticales.

El consumo de tokens en estos escenarios varía mucho en volumen y ritmo de comercialización.

En el extremo C, enfocado en usuarios individuales, se prioriza la accesibilidad, con asistentes IA, generación de contenido y diseño creativo.

Por ejemplo, Wanshing Technology, en software creativo de IA (como Miaoying Factory y Wanshing AI Painting), tiene más de 5.5 millones de usuarios pagos en todo el mundo, y en el primer trimestre de 2026, el consumo de tokens aumentó un 320% interanual, reduciendo el costo por usuario en un 40% gracias a optimizaciones del modelo.

Caisun, con su correo electrónico inteligente y asistente de oficina, tiene más de 300 millones de usuarios, con un consumo diario de tokens que supera los 50 mil millones.

En el extremo B, los servicios empresariales representan más del 65% del consumo de tokens.

Por ejemplo, Tonghuashun ofrece asesoramiento financiero con más de 100 millones de inversores, con un consumo diario de más de 80 mil millones de tokens y un crecimiento del 190% en ingresos relacionados en el primer trimestre de 2026.

Zhongkong Tech proporciona plataformas de IA industrial para sectores como química y energía, con un consumo anual de tokens por fábrica superior a 5 millones.

Runze Medical ha implementado sistemas de diagnóstico asistido por IA en más de 3,000 hospitales en China, con un consumo diario de más de 20 mil millones de tokens en textos médicos.

En general, los escenarios verticales en B2B serán los principales motores de crecimiento a largo plazo, con demandas de tokens en áreas como conducción autónoma, manufactura inteligente y tecnología financiera, que liberarán una demanda de billones de tokens.

03 ¿Qué acciones están en auge?

Desde la perspectiva de las reglas industriales, la industria de tokens ha pasado de una “competencia de modelos” a una “competencia de capacidad y monetización”, con un desajuste entre oferta y demanda y una aceleración en la liberación de valor comercial. Seis empresas líderes en China ya han establecido una posición sólida en hardware de cálculo, modelos intermedios y aplicaciones finales, convirtiéndose en los principales actores en esta economía de billones de yuanes.

Primero, Inspur, como líder en servidores de IA, es la pieza clave en la capacidad de producción de tokens, con la mayor cuota de mercado global en servidores de IA. La empresa tiene una fuerte relación con Nvidia, asegurando cuotas de GPU de alta gama, con una cadena de suministro y barreras de escala insustituibles.

En el primer trimestre de 2026, las entregas de servidores de IA aumentaron un 150% interanual, con una participación de mercado superior al 25%. Tiene pedidos pendientes por casi 40 mil millones de yuanes, con entregas programadas hasta finales de 2027, siendo uno de los actores más confiables en rendimiento en la cadena industrial.

En segundo lugar, Inveric, líder en enfriamiento líquido, cuya tecnología es esencial para la refrigeración de centros de cálculo inteligentes de gran escala, con una densidad de potencia en aumento y una penetración que pasa del 15% en 2024 al 45% en 2026. Sus ingresos en enfriamiento líquido en el primer trimestre de 2026 crecieron más del 210%, con pedidos que se proyectan hasta 2027, siendo uno de los actores con mayor potencial de rendimiento en la parte superior de la cadena.

Kunlun Wanwei, pionero en comercialización de grandes modelos, es el principal en monetización de tokens en China, logrando beneficios a escala con un modelo de negocio que cobra solo una cuarta parte del precio de modelos extranjeros, conquistando rápidamente el mercado de pequeñas y medianas empresas.

En el primer trimestre de 2026, su consumo diario de tokens superó los 1.2 billones, con más de 120,000 clientes B2B, y sus ingresos en IA aumentaron un 450% interanual, manteniendo un margen bruto superior al 42%, siendo la acción más pura en monetización de tokens en China.

iFlytek, líder en grandes modelos verticales, se especializa en educación, salud y sector industrial, con más del 70% del consumo de tokens en estos modelos proveniente de aplicaciones B2B productivas, con una demanda muy rígida.

Gracias a años de experiencia en escenarios y datos, sus servicios personalizados para empresas y gobiernos están creciendo rápidamente, y en 2026, la proporción de ingresos relacionados con IA superará el 60%. A medida que la penetración en sectores verticales aumenta, la compañía se beneficiará de los dividendos a largo plazo de la digitalización industrial.

También está Wanshing Technology, líder en aplicaciones de IA para consumidores en el extranjero, con un núcleo en el consumo de tokens por usuarios individuales. Sus herramientas creativas de IA, como edición de video y pintura IA, tienen más de 5.5 millones de usuarios pagos en todo el mundo. Tras la implementación de funciones de IA, la disposición a pagar y el tiempo de uso aumentaron significativamente, con un crecimiento del 320% en consumo de tokens en el primer trimestre de 2026.

En resumen, el ciclo de bonanza de tokens actual es una oportunidad a largo plazo impulsada por la demanda. A corto plazo, se recomienda priorizar empresas de hardware como Inspur y Inveric, a medio plazo, enfocarse en modelos de negocio y monetización como Kunlun Wanwei, y a largo plazo, apostar por líderes en escenarios verticales como iFlytek. Las empresas de alta calidad podrán experimentar un crecimiento en rendimiento y valoración en esta fase de auge.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado