El uso de tokens se multiplica por 10 en un año, no es de extrañar que los proveedores suban los precios

robot
Generación de resúmenes en curso

Impulsados por la explosión de la demanda global de IA, la escasez de recursos computacionales y el aumento en los costos de hardware, los fabricantes de modelos grandes y los proveedores de servicios en la nube han aumentado sus precios en los últimos tiempos.

El 11 de marzo, Tencent Cloud fue la primera en ajustar su estrategia de facturación, elevando el precio de entrada del modelo de la serie混元Tencent HY2.0 Instruct de 0.0008 yuanes por mil tokens a 0.004505 yuanes, un aumento del 463%; al mismo tiempo, finalizó la prueba gratuita de modelos de terceros como GLM 5 y MiniMax, y los convirtió en productos comerciales oficiales.

El 16 de marzo, Zhipu lanzó su nuevo modelo GLM-5-Turbo y aumentó en un 20% el precio de la API, con un incremento promedio del 83% en comparación con la generación anterior, GLM-4.7.

El 18 de marzo, Alibaba Cloud y Baidu Smart Cloud anunciaron aumentos de precios en el mismo día. Según los anuncios oficiales, Alibaba Cloud ajustará los precios de servicios relacionados con tarjetas de computación como el Tongxin Ge Zhenwu 810E y servicios como CPFS (versión inteligente), con un incremento máximo del 34%; Baidu Smart Cloud, por su parte, aclaró que los precios de productos y servicios relacionados con la capacidad de IA subirán aproximadamente entre un 5% y un 30%, y los precios del almacenamiento de archivos en paralelo aumentarán alrededor del 30%. Ambas compañías atribuyen estos aumentos a la “explosión en la demanda global de IA”.

Aunque no es fácil estimar la demanda total de IA a nivel mundial, se puede vislumbrar una parte a partir de los datos divulgados por OpenRouter, la mayor plataforma de agregación de APIs del mundo. Según se informa, OpenRouter es una plataforma que agrupa APIs de múltiples modelos de inteligencia artificial, permitiendo a usuarios y desarrolladores acceder a diferentes modelos LLM mediante una interfaz unificada para realizar diálogos, como GPT-4, Claude, Gemini, Deepseek, entre otros.

Los datos divulgados por OpenRouter muestran que, en la semana del 24 de marzo de 2025, el volumen de tokens utilizados para llamar a grandes modelos en esa plataforma fue de 1.62 billones, y para la misma semana en este año, el 9 de marzo, esa cantidad ya había aumentado a 16.90 billones, multiplicándose por diez en un año. Especialmente, desde que el 30 de enero de este año se lanzó oficialmente OpenClaw (“Cangrejo”), la velocidad de aumento en el uso de tokens se ha acelerado aún más. En la semana de su lanzamiento, el uso de tokens en esa plataforma fue de 8.25 billones, y en poco más de un mes, esa cifra se duplicó hasta 16.90 billones.

Un informe de Galaxy Securities indica que en la primera semana de marzo de 2026, la plataforma procesó 14.8 billones de tokens, duplicando la cantidad de principios de año, y que los flujos de trabajo impulsados por agentes ya representan más de la mitad del total de tokens generados por la plataforma.

Además, en la semana del 9 de marzo, cuatro modelos grandes nacionales dominaron las listas. MiniMax M2.5 lideró con 1.75 billones, seguido por Step 3.5 Flash (Estrella de Salto) con 1.34 billones y DeepSeek V3.2 con 1.04 billones, en segundo y tercer lugar, respectivamente, y Kimi K2.5 con 0.56 billones en noveno lugar. Desde que en la semana del 9 de febrero, los modelos chinos superaron por primera vez a los estadounidenses en llamadas, MiniMax M2.5 ha mantenido el primer puesto durante cinco semanas consecutivas.

Aunque OpenRouter solo contabiliza las llamadas realizadas a través de su plataforma y no incluye a los usuarios que utilizan directamente las APIs de los fabricantes, su condición como la mayor plataforma de agregación de APIs a nivel mundial permite deducir la fortaleza y la enorme demanda de los modelos grandes nacionales a partir de estos datos.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado