Token se convierte en "bestia devoradora de oro" Las grandes empresas están viendo un aumento descontrolado en su poder de cómputo

robot
Generación de resúmenes en curso

¿Has notado que en estos seis meses el estilo en el mundo de la IA se ha vuelto un poco más rápido?

Por estas fechas el año pasado, todos estaban celebrando a lo grande la bajada de precios de la computación. Alibaba Cloud lideró el grito de “máxima rebaja de 60%”; luego Tencent Cloud, Huawei Cloud y Baidu Cloud siguieron en bloque. Aquello tenía un aire, casi como una gran promoción de “Doble 11”. En los grupos de emprendimiento, todo el mundo compartía facturas cada día: “¡Mira, con estos Token que me costaron un millón, apenas pagué unos céntimos!” En ese entonces, todos pensaban que la primavera del emprendimiento en IA había llegado: la computación estaba tan barata como el repollo, ¿quién no podía montar aplicaciones de modelos a gran escala?

¿Y qué pasó después? El golpe llegó demasiado rápido.

El mes pasado, el viento cambió 180 grados. En un plazo de 10 días, Google, Amazon, Tencent, Alibaba y Baidu emitieron avisos de subida de precios. ¿Cuánto subieron? En general, entre 30% y 50%. El más duro fue Tencent Cloud: un producto central subió directamente 400%.

De “remate de derrumbe” a “subida tipo cohete” en menos de un año. ¿Qué ocurrió exactamente? ¿Quién está empujando los precios hacia arriba por detrás? Y lo más importante: en esta ola de subidas, ¿quién es el que más sufre y quién es el que se ríe por lo bajo?

¿El año pasado seguían “haciendo descuentos brutales”; y este año por qué suben precios en conjunto?

Primero, repasemos de forma sencilla esta “obra de gran giro”.

En abril de 2025, Alibaba Cloud lanzó primero una bomba de gran calibre: la rebaja máxima del precio en productos core. Esto no fue un simple ajuste menor, sino un “recorte a la mitad y luego descuentos”. Inmediatamente después, JD Cloud dijo “rebajen lo que sea, yo también”; Tencent Cloud, Huawei Cloud y Baidu Cloud siguieron todos el mismo paso. En ese momento, el mercado de la computación estaba lleno de humo de pólvora y la guerra de precios se puso realmente animada.

¿Cuáles eran los eslóganes entonces? “Que la IA sea asequible” y “democratizar la computación”. Muchas startups de verdad se lo creyeron y empezaron a quemar Token a lo grande y a ejecutar modelos.

Pero el almuerzo gratis nunca dura mucho.

En enero de 2026, Amazon AWS hizo algo en silencio: sin ningún anuncio en una conferencia, sin ninguna previa; simplemente subió el precio de servidores EC2 en alrededor de 15%. No mires solo que el porcentaje no es enorme: la importancia es enorme. Esto fue la primera subida de precios en la industria de servicios cloud en casi veinte años. Y hay que saber esto: en los últimos veinte años, las veces que AWS bajó precios superaron el centenar; siempre era hacia abajo, nunca hacia arriba.

Eso fue como tumbar una fila de fichas de dominó.

El 11 de marzo, Tencent Cloud siguió el movimiento: en su modelo Tencent HY2.0 Instruct, el precio de entrada pasó de 0.0008 yuanes por 1000 tokens a 0.004505 yuanes por 1000 tokens—un incremento de 463%, más de cuatro veces. El 18 de marzo, Alibaba Cloud anunció que los productos de tarjetas de computación subían entre 5% y 34%; Baidu Intelligent Cloud también subió entre 5% y 30%. Aquellos modelos de gran escala que antes tenían pruebas gratuitas, como GLM 5, MiniMax 2.5 y Kimi 2.5, terminaron por completo la “época del consumo gratis” y pasaron a la facturación oficial.

De “competir por bajar precios” a “competir por subir precios”, ¿por qué el cambio fue tan rápido?

A simple vista, parece que los proveedores cloud no pueden aguantar. Los chips GPU cuestan cada vez más; la electricidad de los centros de datos representa entre 40% y 60% de los costos operativos; y además en la segunda mitad de 2025 también empezaron a subir los precios de los chips de almacenamiento. La presión del lado de los costos se hizo realmente palpable. Pero lo que realmente convirtió la subida en “algo que no queda más remedio que hacer” fue otra razón, más fundamental: la computación, de verdad, ya no alcanza.

¿Quién está “devorando” frenéticamente Token? La verdad de 140 billones

¿Antes no se decía que había exceso de capacidad de computación? ¿Cómo que de repente ya no alcanza?

La respuesta es: Token se está “consumiendo” demasiado rápido.

Según los datos divulgados este marzo por el director de la Administración Nacional de Datos, Liu Liehong: para marzo de 2026, el volumen diario de llamadas a Token en China ya superó los 140 billones.

¿De qué tan exagerado hablamos? Te doy dos referencias:

· A principios de 2024, esa cifra era solo 100 mil millones. En dos años, subió más de mil veces.

· A finales de 2025, esa cifra era 100 billones. O sea, solo en los últimos tres meses volvió a subir 40%. Ese aumento de 40 billones en solo tres meses es 400 veces el total del día entero de principios de 2024.

Esto no es crecimiento lineal, es un tsunami.

Entonces, surge la pregunta: ¿quién está consumiendo Token de manera desenfrenada?

Hay una sola palabra: agentes (Agent).

A partir del año pasado, los productos de agentes de código abierto, encabezados por OpenClaw (en el mundillo conocido como “langosta”), se hicieron increíblemente populares. La IA pasó de ser un robot que solo “chateaba” a convertirse en un asistente que “hace el trabajo”: te ayuda a reservar boletos, escribir código, hacer PPT, analizar datos… ¿Suena genial, no? Pero el costo es que, cuando el agente hace una tarea simple, consume entre 10 y 100 veces más Token que una conversación normal.

Un ejemplo: pedirle a la IA que te escriba un script de crawler. Si es una conversación normal, te entrega un fragmento de código, lo copias y te vas, consumiendo unos cientos de Token. Pero si es un agente, el sistema tiene que ejecutar el código por su cuenta, reportar errores, depurar, volver a ejecutar, y así sucesivamente… De ida y vuelta, diez o más iteraciones; el consumo de Token va directo a decenas de miles.

Y ni hablar de la generación de video, ese “devorador” de recursos. Un análisis indicó que generar un video de 1 minuto consume aproximadamente 10 billones de Token. Y ahora, los modelos de video: generar 5 segundos te cuesta solo desde unos cuantos céntimos hasta unos pocos yuanes. Esto no es ganar dinero; es claramente perder dinero para ganar publicidad. Pero aun así, como la gente lo usa muchísimo, videos, música, código, análisis de datos… cada área está consumiendo Token de forma frenética.

Si la oferta no sigue el ritmo de la demanda, la computación inevitablemente sube de precio. Esto no es conspiración; es un desequilibrio crudo entre oferta y demanda.

Competencia de posicionamiento en computación: las grandes empresas se comen la carne; los pequeños ni siquiera pueden beber la sopa

Sobre el tema del aumento de precios, para distintas personas significa cosas completamente diferentes.

Para los proveedores cloud, subir precios en realidad es algo bueno. Un broker calculó una cifra: por cada 1% que Alibaba Cloud sube el precio, su margen de beneficio puede mejorar en 1 punto porcentual. Por eso, lo que ves en los datos es que la participación de Alibaba Cloud no cae, sino que sube; ya representa el 36% del mercado cloud de IA en China. Y en el segmento más específico de volumen de llamadas a IA, Volcano Engine (de ByteDance) aún domina con casi 50%; es decir, la mitad de las llamadas de Token en todo China pasan por los tubos de Volcano Engine.

Mientras tanto, las participaciones de Huawei Cloud y Tencent Cloud se deslizan ligeramente hacia abajo. El efecto de los gigantes es cada vez más evidente: las grandes empresas se fortalecen más y los recursos se concentran cada vez más.

Entonces, ¿quién es el más perjudicado?

Las startups de IA de tamaño medio y pequeño, y esos pequeños jugadores que acaban de entrar.

La razón es simple: la subida de precios eleva directamente sus costos operativos. Antes, cuando Token era barato, podías ejecutar experimentos y ajustar modelos sin preocuparte por unos pocos gastos. Ahora, con precios multiplicados por varias veces o incluso por más de diez; cada ronda de entrenamiento y cada inferencia hay que sopesarla.

Lo que además complica es que los pequeños jugadores no tienen poder de negociación. Los grandes clientes pueden firmar acuerdos a largo plazo con los proveedores cloud, fijando un precio relativamente preferente. Si eres una empresa inicial que solo gasta decenas de miles de yuanes al año en costos de computación, ¿con quién vas a negociar descuentos? Solo puedes pagar honestamente el precio después de la subida.

Mucha gente que originalmente planeaba hacer aplicaciones de IA, después de calcularlo, simplemente lo pospone en silencio. Y otras que ya estaban haciéndolo: o reducen el tamaño, o cargan con pérdidas y aguantan como pueden. Pero justo el mercado terminal compite con mucha intensidad; no te atreves a subir precios a los usuarios fácilmente. Al lado hay alguien ofreciendo gratis; si tú cobras, todos se van. Al final, toda la presión de costos solo puede tragársela uno mismo.

Un profesional me dijo con queja: “Antes pensaba que la computación era barata y que el umbral de entrada al emprendimiento era bajo. Ahora descubro que el umbral no bajó: te dejan entrar primero y luego te cierran la puerta.”

Esto en realidad es una competencia de posicionamiento cruel. Durante los últimos veinte años, los proveedores cloud han vivido bien con una estrategia de “bajar precios para vender volumen, y luego ganar después de acaparar terreno”. Pero ese tiempo terminó. La computación se despide oficialmente de la etapa de subsidios y entra en la fase de fijación comercial de precios. En el futuro, ya no se trata de quién es más barato; se trata de quién ofrece un servicio más estable, quién tiene un ecosistema más completo y quién puede ayudar a las empresas a aprovechar de verdad cada unidad de computación.

Y en esta competencia de posicionamiento, es muy probable que los pequeños jugadores se queden atrás.

Mirando el sube y baja de este año y pico, te darás cuenta de una verdad bastante dolorosa:

De “precio de repollo” a “precio tipo cohete”, en esencia, refleja el paso de la industria de la IA desde el crecimiento salvaje hacia la madurez. Termina la era gratis y empieza la competencia por valor. Los modelos de negocio que dependían de subsidios morirán; y los productos que realmente tienen tecnología, escenarios y usuarios podrán sobrevivir en un entorno donde suben los costos de computación, e incluso vivirán mejor.

La competencia central en un emprendimiento de IA, nunca ha sido lo barata que es la computación; sino qué haces con la computación.

En la era de la computación, Token sí es caro. Pero lo más caro que Token es una mente que sabe cómo aprovechar bien Token.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado