El costo efectivo por token se convertirá en un indicador clave de competencia en la industria de la potencia de cálculo

robot
Generación de resúmenes en curso

El periodista Guo Bohao de Securities Times

“La infraestructura de computación que respalda el desarrollo de la inteligencia artificial (IA) está cambiando gradualmente de ser una ‘fábrica de potencia de cálculo’ a una ‘fábrica de tokens’.” En la reunión anual del Foro Zhongguancun 2026, Li Bin, vicepresidente senior de Sugon, hizo este juicio, señalando directamente la transformación lógica fundamental que está ocurriendo en la industria de la potencia de cálculo de IA.

Con la aceleración completa del proceso de comercialización de la industria de IA, la medida de competencia en el sector está cambiando. De una competencia basada en la escala de hardware de potencia de cálculo, a una competencia más refinada en la eficiencia del uso de la potencia y la capacidad de suministro efectivo de tokens. Cómo hacer que una unidad de potencia de cálculo produzca más tokens de alta calidad se ha convertido en una cuestión clave que determinará el futuro patrón de la industria de potencia de cálculo.

Recientemente, fenómenos como OpenClaw (conocido popularmente como “Langosta”) y otros agentes inteligentes de IA han impulsado directamente una expansión exponencial en la demanda global de tokens. Datos de la plataforma de agregación de modelos de IA de terceros OpenRouter muestran que, en la semana del 9 al 15 de marzo de 2026, un solo OpenClaw contribuyó con el 20% del consumo de tokens en la plataforma; su consumo semanal de tokens ya equivale al 60% del consumo promedio semanal de tokens en toda la plataforma en el cuarto trimestre de 2025.

La implementación a gran escala de agentes inteligentes de IA está reescribiendo la curva de crecimiento de la demanda de tokens y también plantea nuevas demandas para la capacidad de suministro de infraestructura de potencia de cálculo. Como afirmó Ao Yulong, responsable del desarrollo del marco de IA en el Instituto de Investigación de Inteligencia Artificial de Zhongguancun, la industria de IA está transformándose de una “oferta de potencia de cálculo” a una “oferta efectiva de tokens”, y en el futuro, el costo de los tokens efectivos será un indicador clave de competencia en la industria de potencia de cálculo.

He Shuibing, subdirector del Laboratorio de Zhejiang, señaló que la expansión de la escala de potencia de cálculo no equivale a una mejora sincronizada en la capacidad de producción de tokens. Problemas como cuellos de botella en la programación, rendimiento de comunicación y almacenamiento, afectarán la eficiencia de liberación de potencia de cálculo y reducirán la eficiencia de producción de tokens por unidad de potencia. “Tomando como ejemplo un clúster de 1000 tarjetas H100, el costo anual de potencia de cálculo es de aproximadamente 1.2 mil millones de yuanes. Si la tasa de utilización de la potencia de cálculo tiene una pérdida del 10%, la pérdida económica directa anual superará los 120 millones de yuanes”, ejemplificó He Shuibing.

Para abordar los principales problemas de la industria, varios expertos consideran que la innovación en arquitecturas, representada por los supernodos, es una vía importante para mejorar la eficiencia de la potencia de cálculo y lograr una conversión eficiente de potencia en tokens. Los supernodos, mediante arquitecturas de interconexión ultra rápida, transforman clústeres distribuidos en máquinas de gran escala, resolviendo fundamentalmente los cuellos de botella de comunicación en arquitecturas tradicionales y logrando un aumento en la eficiencia del uso de la potencia de cálculo.

Wang Zixiao, responsable de tecnología de redes inteligentes en el Instituto de Investigación de Redes y Nubes de China Telecom, explicó que, usando productos de supernodos, el rendimiento en inferencia en pruebas reales aumentó 2.6 veces en comparación con las configuraciones tradicionales de 8 tarjetas, reduciendo directamente la escala de hardware necesaria para producir la misma cantidad de tokens. Li Ran, experto en soluciones de IA de Sugon, también afirmó que el reciente lanzamiento de ScaleX40, un supernodo, en escenarios típicos de inferencia, mejora la capacidad de procesamiento de inferencias en más de 4 veces en comparación con las configuraciones tradicionales de 8 tarjetas, lo que puede mejorar significativamente la capacidad de producción de tokens por unidad de potencia y proporcionar un soporte de potencia de cálculo inclusivo para la industria de IA.

En cuanto al futuro desarrollo de la industria, los participantes coinciden en que en los próximos 3 a 5 años, la innovación central se centrará en la reducción del costo de los tokens efectivos, y la colaboración profunda entre potencia de cálculo y aplicaciones, la optimización de toda la pila de hardware y software, y la cooperación en toda la cadena industrial serán las principales áreas de avance. Esto impulsará la transformación de la industria de potencia de cálculo desde la acumulación de hardware hacia la mejora del rendimiento del sistema, apoyando de manera eficiente la integración profunda de IA en diversas industrias.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado