Token es capacidad de producción. La guerra de precios de modelos grandes se ha iniciado.

robot
Generación de resúmenes en curso

Periódico de Valores, reportero Yuan Chuanxi

Recientemente, la ola de despliegue de agentes de inteligencia artificial (IA) está barriendo todos los sectores. Los agentes de IA se están integrando en los escenarios cotidianos de trabajo y vida a una velocidad sin precedentes.

Detrás de esta tendencia, se encuentra una demanda explosiva de capacidad de cálculo: la implementación masiva de agentes de IA personales ha generado un consumo masivo de Tokens (identificadores digitales en el ámbito informático), rompiendo rápidamente las barreras de costo originales de los fabricantes de grandes modelos.

Recientemente, empresas nacionales de IA como Beijing Zhipu Huazhang Technology Co., Ltd. (en adelante, “Zhipu”) y Tencent Cloud han publicado de manera intensiva notificaciones de aumento de precios en sus productos de capacidad de cálculo de IA, con incrementos que en algunos casos superan el 400%. Este cambio estratégico, de “quemar dinero para crecer” a “reducir precios para aumentar volumen”, no solo marca el fin del crecimiento salvaje en la industria, sino que también refleja una profunda transformación en la relación entre oferta y demanda de capacidad de cálculo en la era de los agentes de IA.

Reconstrucción del sistema de precios de grandes modelos

El sistema de precios en la industria de grandes modelos está experimentando una reestructuración sistemática, y los fabricantes nacionales están acelerando el ajuste al alza de los precios de sus productos relacionados. Este fenómeno de aumento de precios contrasta claramente con la guerra de precios de hace dos años.

En mayo de 2024, ByteDance dio inicio a la primera ofensiva en la guerra de precios, estableciendo el precio del modelo Doubao Pro en 0.0008 yuanes por mil Tokens, un 99.3% por debajo del precio promedio del sector. Posteriormente, Alibaba Cloud redujo en un 97% el precio de su modelo principal Tongyi Qianwen, y los dos principales modelos de Baidu, Wenxin y otros, se ofrecieron completamente gratis. Tencent también redujo el precio de su modelo Hunyuan en hasta un 87.5%. Por un momento, la industria se vio sumida en una ola de bajadas de precios.

“En ese entonces, la lógica era muy simple: primero que los desarrolladores lo usaran, la cuota de mercado era lo más importante.” Un gerente de producto de IA con tres años en la industria reveló a Periódico de Valores que, en una empresa líder en 2024, se había establecido un objetivo audaz de no buscar beneficios durante tres años, incluso con precios por debajo del costo de cálculo.

Sin embargo, los efectos marginales de la estrategia de precios bajos se agotaron rápidamente. Un analista de la industria afirmó a este periódico que, aunque la guerra de precios aceleró la adopción de grandes modelos de IA en el mercado, también llevó a la industria a una situación de “altos costos, bajos retornos”. Cuando el volumen de llamadas a los modelos pasó de cientos de miles de millones a billones, los costos de cálculo se multiplicaron exponencialmente, haciendo insostenible depender únicamente de inyecciones de capital. Desde la segunda mitad de 2025, algunos pequeños y medianos fabricantes comenzaron a reducir silenciosamente sus cuotas gratuitas.

“Esto no es simplemente un aumento de precios, sino el resultado inevitable de cambios en la estructura de costos.” Un responsable técnico de un proveedor líder de servicios en la nube explicó a Periódico de Valores: “Antes, la industria usaba pérdidas para ganar cuota de mercado; en 2026, debemos pensar en la sostenibilidad.”

Inflación de Tokens

Para entender la subida colectiva de precios en los grandes modelos nacionales, primero hay que comprender el concepto de “inflación de Tokens”.

Un Token es la unidad mínima de procesamiento de texto en un gran modelo, y puede entenderse como una medida de carga de trabajo de IA. Cuando la industria habla de inflación de Tokens, en realidad se refiere a un aumento explosivo en la complejidad de las tareas que la IA debe manejar, lo que hace que los mismos servicios requieran más recursos de cálculo. Es como pasar de encender una pequeña lámpara a abrir una fábrica, donde la factura de electricidad sube naturalmente.

Esta presión inflacionaria proviene principalmente del auge de la demanda en mercados internacionales. En febrero de 2026, la plataforma OpenRouter (el principal distribuidor global de APIs de grandes modelos) reportó que en ese mes, el consumo total de Tokens de los diez principales modelos de IA en todo el mundo superó los 27 billones, de los cuales China contribuyó con 14 billones, más del 50%.

“Esto significa que los grandes modelos nacionales están pasando de ser impulsados por la demanda interna a una exportación global.” Zhang Yi, CEO de Guangzhou iMedia Data & Intelligence Consulting Co., Ltd., afirmó en una entrevista con Periódico de Valores: “Los hábitos de uso en el extranjero son completamente diferentes a los domésticos.” Los desarrolladores en Europa y Estados Unidos prefieren integrar grandes modelos en flujos de trabajo productivos, donde una sola solicitud suele implicar múltiples llamadas a herramientas, búsquedas de contexto extendido y generación de código. “Una misma llamada API puede consumir entre tres y cinco veces más Tokens en escenarios internacionales que en el mercado chino.”

Si el mercado exterior es una causa externa, la implementación a gran escala de agentes de IA es la causa interna que impulsa los costos de cálculo al alza.

A diferencia de la era de los chatbots en preguntas y respuestas, los agentes de IA poseen un ciclo cerrado de “percepción – decisión – ejecución”, capaces de completar tareas complejas de forma autónoma. Por ejemplo, en escenarios de gestión de riesgos financieros: un agente de IA que aprueba un crédito individual debe realizar cuatro etapas: recuperación de perfil del usuario (contexto largo), llamada a datos crediticios (uso de herramientas), cálculo de evaluación de riesgos (cadena de inferencias) y generación de informes (salida). El consumo total de Tokens en todo el proceso puede alcanzar decenas de miles de millones.

Varios factores se combinan, produciendo resultados sorprendentes. Según cálculos de China United Minsheng Securities, el consumo diario total de Tokens en China pasó de unos 100 mil millones a principios de 2024 a 180 billones en febrero de 2026. Además, a medida que los agentes de IA evolucionan hacia modalidades múltiples y colaboración entre múltiples agentes, esta cifra continúa acelerándose.

La inversión y la demanda se han invertido, y esto se refleja en los precios. Desde 2025, la infraestructura global de capacidad de cálculo en IA enfrenta escasez de producción. La tensión en el suministro de memoria HBM (memoria de alto ancho de banda, componente clave en entrenamiento de IA) y GPU de proceso avanzado (procesadores gráficos) ha provocado un aumento significativo en los costos de adquisición de servidores en comparación con el año anterior.

Por ejemplo, el 17 de marzo, Alibaba Cloud anunció que, debido a la explosión de demanda global de IA y al aumento de precios en la cadena de suministro, sus productos de capacidad de cálculo y almacenamiento de IA aumentaron hasta un 34%.

Cuando los fabricantes de grandes modelos pasan de ser “vendedores de agua” a “consumidores de agua”, el aumento de precios se vuelve una opción rígida para mantener la calidad del servicio. En su anuncio de ajuste de precios, Zhipu afirmó claramente: “El rápido crecimiento en la escala de usuarios y llamadas requiere que aumentemos la inversión en capacidad de cálculo.”

Reconstrucción del modelo de negocio

El aumento de precios no solo cubre la brecha de costos, sino que también implica una profunda reestructuración de toda la lógica comercial de la industria.

“Cuando termine la guerra de precios, la verdadera batalla por el valor comenzará.” El responsable técnico mencionado anteriormente afirmó que 2026 será el año de la aplicación comercial masiva de IA, y que la competencia en la industria se centrará en ofrecer servicios de modelos y aplicaciones de IA eficientes, estables y de bajo costo, en lugar de simplemente poseer capacidad de cálculo.

Actualmente, la industria de grandes modelos está pasando de “subsidios por tráfico” a “selección por valor”. La estrategia inicial de precios bajos atrajo a muchos usuarios en fase de prueba, pero también provocó un uso ineficiente de recursos de cálculo. Una empresa estimó que el 40% de las cuotas gratuitas se consumían en llamadas de prueba sin un escenario de negocio real. Al aumentar moderadamente los precios, las empresas pueden filtrar demandas no esenciales y garantizar la estabilidad del servicio para clientes de alta calidad. La significativa subida de precios de Zhipu, Tencent Cloud y otros, en realidad, busca equilibrar la disposición a pagar y el retorno de inversión (ROI) de clientes empresariales. Esta operación de “reducir precios para aumentar volumen” y la gestión refinada marcan la transición de la industria china de modelos grandes desde una expansión basada en internet hacia una fijación de precios basada en el valor en el sector del software.

El Comité de Expertos en Economía de las Tecnologías de la Información y las Comunicaciones del Ministerio de Industria y Tecnología de la Información afirmó a Periódico de Valores que el aumento de precios no frenará la demanda real, sino que acelerará la “eliminación del mal con el buen dinero”. Los clientes empresariales, con altas exigencias en estabilidad y cumplimiento, están dispuestos a pagar más, ya que su valor de vida útil y su disposición a pagar superan ampliamente a los usuarios de largo plazo. Esto da confianza a los fabricantes de grandes modelos para cambiar de una mentalidad de “tráfico” a una de “valoración”.

Este cambio está redefiniendo toda la estructura de beneficios en la cadena industrial. Los proveedores de capacidad de cálculo en la parte superior, como NVIDIA, continúan beneficiándose; los proveedores de servicios en la nube en el medio, como Alibaba Cloud y Tencent Cloud, buscan equilibrar la venta de modelos y capacidad de cálculo, intentando atraer clientes con servicios de IA sin verse ahogados por los altos costos; y en la capa de aplicaciones, se observa una clara diferenciación: grandes empresas con capacidad de investigación y desarrollo interno (como ByteDance y Baidu) pueden gestionar flexiblemente sus recursos de cálculo para mitigar riesgos de aumento de precios, mientras que pequeñas y medianas startups que dependen únicamente de llamadas API enfrentan costos en aumento y, en algunos casos, cierre forzado.

Los fabricantes de grandes modelos para clientes empresariales también comienzan a centrarse en la profunda transformación de la economía de Tokens. Yang Lei, cofundador y director ejecutivo de DeepTech Co., Ltd., afirmó a Periódico de Valores: “En el futuro, Tokens será la capacidad productiva. A medida que los modelos basados en habilidades (Skill-based Models) transformen industrias como el desarrollo de software, análisis de datos y externalización de atención al cliente, el método tradicional de fijación de precios por persona y día será reemplazado por la valoración basada en el consumo de Tokens. Esto no solo es un cambio en la unidad de medición, sino un salto en el paradigma de productividad.”

Zhang Yi señaló que, desde una perspectiva de competencia global, la inflación de Tokens también es un subproducto de la transición tecnológica de los modelos nacionales. La subida de precios no es el fin, sino el comienzo de una nueva revolución en eficiencia. Quien pueda optimizar continuamente su estructura de costos en esta carrera armamentística de capacidad de cálculo, podrá mantener su posición en la mesa global de agentes de IA en la era de los agentes inteligentes.

Al mirar hacia atrás a la guerra de precios de 2024 y compararla con la actual tendencia de aumento colectivo de precios, la industria de grandes modelos en China está atravesando una dolorosa etapa de maduración. La era en la que se buscaba llamar la atención con precios bajos ha quedado atrás; la nueva era, basada en la eficiencia tecnológica, el valor para el cliente y un ecosistema cerrado, se despliega lentamente en medio de la corriente del economía de Tokens.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado