Una burbuja provocada por Nvidia está a punto de estallar.

Fuente: AGI interfaz

A mediados de mayo, durante la ventana de 90 días de suspensión de aranceles, estalló una intensa lucha por los recursos centrales de poder de cálculo.

"Los precios de los servidores están muy volátiles, hace un tiempo el precio de cada unidad había aumentado entre un 15% y un 20%. Con la suspensión de los aranceles, planeamos volver a vender a los precios originales." Un proveedor de chips de una región del sur reveló a Huxiu.

Al mismo tiempo, el lado de la oferta del mercado también ha recibido nuevas variables. Según información exclusiva de Tiger Sniff, la serie de productos de alta gama Hooper de Nvidia y la serie Blackwell han aparecido silenciosamente en el mercado nacional, siendo el momento de aparición de la primera aproximadamente en septiembre de 2024, mientras que la segunda ocurrió recientemente. Un alto ejecutivo de Huari Intelligent Computing declaró: "Los canales de obtención de suministros de diferentes proveedores son muy diversos." Y la compleja red de suministro detrás de esto es inexplorable.

(Nota de Huxiu: A partir del 17 de octubre de 2023, Washington ha comenzado a detener gradualmente la venta de chips de Nvidia a China, incluidos A100, A800, H800, H100, H200; recientemente, la última tarjeta de la serie Hooper que se podía vender a China, H20, también ha sido incluida en la lista de restricciones de exportación)

Entre ellos, la serie de gama alta Nvidia Hooper generalmente se refiere a H200, que es una versión mejorada del chip H100, el primero es solo más caro que el segundo, pero la eficiencia es un 30% mayor. La serie Blackwell pertenece a la serie de gama alta de NVIDIA, de la cual el precio de B200 es tan alto como más de 3 millones, y también es el producto de "circulación restringida" en la actualidad, y su ruta de circulación es más secreta. Ambos se utilizan para el preentrenamiento de modelos grandes, y el B200 es "difícil de encontrar".

Retrocediendo en la línea de tiempo, en abril de 2024, una foto de Jensen Huang con Ultraman (Sam Altman) y el cofundador de OpenAI, Greg Brockman, circuló en Twitter. Detrás de esta fotografía se encuentra un punto clave de entrega del primer lote de productos H200: el CEO de NVIDIA, Jensen Huang, entregó personalmente el pedido, y OpenAI fue uno de los primeros usuarios del H200.

Tan solo 5 meses después, la noticia del suministro de H200 llegó desde el otro lado del océano. Hoy en día, existen proveedores nacionales con una capacidad de suministro de 100 servidores H200 por semana. Según el proveedor, con la interrupción de H100, la demanda del mercado se está acelerando a H200, y no hay más de diez proveedores que actualmente tienen el suministro de H200, y la brecha entre la oferta y la demanda se está ampliando aún más.

"Lo que más falta en el mercado ahora es H200, y según tengo entendido, hay una empresa de nube que recientemente está buscando H200 por todas partes." Un veterano de la industria de la potencia computacional con 18 años de experiencia le dijo a Huxiu que han estado proporcionando servicios de potencia computacional a Baidu, Alibaba, Tencent y Byte.

En esta carrera armamentista de poder informático, la cadena de transacciones está envuelta en misterio. Según un importante proveedor nacional de potencia de cómputo, la regla de fijación de precios de la potencia de cómputo prevaleciente en la industria es que solo la unidad de potencia de cómputo "P" está marcada en el contrato, lo que convierte la transacción del servidor en una transacción abstracta de potencia de cómputo. Por ejemplo, cuando el usuario de potencia de cálculo y el proveedor de potencia de cálculo realizan una transacción de potencia de cálculo, el modelo de tarjeta no se escribirá directamente en el contrato, sino que la potencia de cálculo de la cantidad de P se utilizará en su lugar, es decir, el modelo de tarjeta específico no se escribirá en el lado positivo.

Profundizando en la cadena de suministro, una red de transacciones oculta sale a la luz. Anteriormente, algunos medios informaron que ciertos distribuidores en China, a través de canales de compra especiales, lograron que los servidores "salieran al mercado de forma indirecta" mediante reventa y empaquetado en múltiples capas. Además, Huxiu ha llegado a conocer que algunos distribuidores han encontrado un camino alternativo, aprovechando empresas de terceros para obtener servidores mediante la incorporación de módulos en los productos.

Detrás de la cadena industrial agitada, el desarrollo de la industria de la potencia de cálculo en el país también está mostrando nuevas tendencias.

01 ¿De dónde viene la burbuja de la computación inteligente?

A finales de 2023, la "prohibición de Nvidia" desde el otro lado del océano cayó como una gran roca en la superficie tranquila de un lago, dando inicio a una guerra oscura en torno a los recursos esenciales de poder de cálculo.

En los primeros meses, el mercado mostró un caos e inquietud primitivos. Bajo la tentación de grandes ganancias, algunas personas con un agudo sentido del olfato comenzaron a tomar riesgos. "En ese momento, el mercado estaba lleno de 'proveedores' de todos los orígenes, desde estudiantes extranjeros que regresaban del extranjero hasta personas bien informadas", recordó una fuente de la industria, que no quiso ser identificada. ”

Estos primeros "pioneros" aprovecharon la brecha de información y varios canales informales para suministrar al mercado las tarjetas gráficas de gama alta de NVIDIA. Como resultado, el precio de las tarjetas gráficas ha aumentado naturalmente. Según algunos informes de los medios, algunos proveedores individuales incluso han fijado el precio de la tarjeta gráfica Nvidia A100 en 128.000 yuanes, superando con creces su precio de venta oficial sugerido de unos 10.000 dólares. Además, algunas personas tienen chips H100 en sus manos en las plataformas de redes sociales, diciendo que el precio de un solo chip es tan alto como 250,000 yuanes. En ese momento, se podría decir que los comportamientos y gestos mencionados anteriormente eran casi ostentosos.

Bajo esta circulación secreta, algunos grandes proveedores de potencia de cálculo han comenzado a tener canales de red de transacciones similares, y la ola de inteligencia computacional que se ha generado también ha surgido en el mismo período. Entre 2022 y 2024, se han apresurado a construir centros de inteligencia computacional en varias localidades. Según datos, solo en 2024, los proyectos de centros de inteligencia computacional superaron los 458.

Sin embargo, esta intensa "ola de especulación de tarjetas y de computación inteligente" no duró mucho tiempo. A finales de 2024, especialmente con la aparición de modelos nacionales como DeepSeek que ofrecen una alta relación calidad-precio, algunos proveedores de potencia de cálculo que dependían únicamente de "acumular tarjetas" o carecían de un soporte técnico central encontraron que su historia se volvía cada vez más difícil de contar. La burbuja de la computación inteligente también comenzó a mostrar signos de ruptura.

Según las estadísticas, en el primer trimestre de 2025, hubo 165 proyectos de centros de inteligencia computacional en la parte continental de China que mostraron nuevas dinámicas, de los cuales hasta el 58% (95 proyectos) aún se encontraban en estado de aprobación o preparación, otro 33% (54 proyectos) estaban en construcción o a punto de entrar en producción, mientras que solo 16 proyectos lograron entrar en producción o en fase de prueba, lo que representa menos del 10%.

Por supuesto, no solo el país muestra signos de ruptura de burbujas. En los últimos seis meses, se ha informado que Meta, Microsoft y otros han suspendido algunos proyectos de centros de datos globales. El otro lado de la burbuja son la preocupante ineficiencia y el desperdicio.

Un profesional de la industria le dijo a Huxiu: "Actualmente, la tasa de activación de los centros de computación inteligente es inferior al 50%, y los chips nacionales, debido a sus deficiencias de rendimiento, no pueden utilizarse para el preentrenamiento. Además, algunos centros de computación inteligente utilizan servidores relativamente obsoletos."

Este fenómeno de "no poder utilizar la tarjeta" ha sido atribuido por los profesionales de la industria a "desajuste estructural" — no se trata de un exceso absoluto de capacidad de cálculo, sino de una insuficiencia en la oferta de capacidad de cálculo efectiva que pueda satisfacer la demanda de alta gama, mientras que una gran cantidad de recursos de capacidad de cálculo ya construidos no pueden ser utilizados de manera óptima debido a la obsolescencia tecnológica, la falta de un ecosistema completo o la insuficiencia en la capacidad operativa.

Sin embargo, en el paisaje de la inteligencia artificial donde coexisten el bullicio y la preocupación, los gigantes tecnológicos muestran una postura completamente diferente.

Según los informes, ByteDance planea invertir más de 12.300 millones de dólares (unos 89.200 millones de yuanes) en infraestructura de IA en 2025, de los cuales 40.000 millones de yuanes del presupuesto se utilizarán para comprar chips de IA en China, y se prevé que otros 50.000 millones de yuanes se utilicen para comprar chips de Nvidia. En este sentido, Byte respondió a Tiger Sniff que la noticia era inexacta.

Otro gran jugador que también está invirtiendo en IA es Alibaba. El CEO Wu Yongming anunció públicamente el 24 de febrero que Alibaba planea invertir 380 mil millones de yuanes en infraestructura de IA en los próximos tres años. Esta cifra incluso supera la suma total de los últimos diez años.

Pero frente a las grandes compras, también se está destacando la presión en el lado de la oferta. "El suministro del mercado no es suficiente para abastecer a las grandes empresas, muchas compañías que firmaron contratos no pueden entregar sus productos. " Dijo un vendedor de un proveedor de inteligencia computacional a Huxiu.

En comparación, la burbuja de inteligencia computacional mencionada anteriormente parece contrastar fuertemente con la gran inversión de las grandes empresas en la infraestructura de IA: por un lado, los proveedores de poder de cálculo liderados por las acciones A están suspendiendo proyectos de inteligencia computacional a gran escala, mientras que por otro lado, las grandes empresas están invirtiendo activamente en la infraestructura de IA.

Y la razón detrás de esto no es difícil de entender. Porque el momento en que la inteligencia artificial comenzó a enfriarse coincide con el periodo alrededor de DeepSeek. Desde este año, ya no se ha mencionado el concepto relacionado con la "guerra de los cien modelos"; DeepSeek ha hecho estallar la burbuja de la demanda de entrenamiento. Ahora, solo quedan en la mesa los grandes empresas y algunas compañías de modelos de IA.

Al respecto, Feng Bo, socio gerente de Chang Lei Capital, también le dijo a Huxiu: "Cuando el entrenamiento no es diverso, las personas realmente capacitadas y cualificadas para entrenar seguirán comprando tarjetas para entrenar, como Alibaba y ByteDance, mientras que aquellos que no tienen la capacidad para hacer entrenamiento se quedarán atrás, y el poder de cómputo en manos de estas personas se convertirá en un espejismo."

02 Potencia de cálculo cancelada

Cualquier nacimiento de "burbuja" está arraigado en la imaginación irracional de la escasez por parte de los humanos. Aquellos que especulan con Moutai y acaparan capacidad de cómputo no son en sí mismos entusiastas de Moutai ni consumidores de capacidad de cómputo, sino que comparten una mentalidad especulativa.

Hasta finales de 2024 y el primer trimestre de 2025, varias empresas como Feilixin, Lianhua Holdings y Jinjishi Co., Ltd. han rescindido contratos de arrendamiento de potencia de cómputo por varios cientos de millones de yuanes. Al mismo tiempo, un proveedor de potencia de cómputo le dijo a Hu Xiu: "En el negocio de arrendamiento de potencia de cómputo, devolver el arrendamiento es algo común."

Estas empresas que han terminado sus arrendamientos no son verdaderos terminales de demanda de poder de cómputo. Con la conmoción en la industria provocada por DeepSeek, la burbuja de la industria de la IA está estallando gradualmente, y muchos proveedores de poder de cómputo se ven obligados a enfrentar el problema de la sobrecapacidad, buscando por todas partes fuentes de clientes estables y explorando nuevas vías para la absorción de poder de cómputo.

Huxiu descubrió en una investigación que en la tarjeta de presentación de un fundador de un proveedor de potencia de cálculo, además de tres empresas en los campos de inteligencia computacional y computación en la nube, también aparecía claramente una empresa de inversión. Al profundizar más, se descubrió que los proyectos en los que invierte esta empresa de inversión incluyen una empresa de robótica y una empresa centrada en el desarrollo de grandes modelos y sistemas en la nube. El fundador reveló a Huxiu: "Toda la demanda de potencia de cálculo de estas dos empresas en las que invierte se satisface a través de su propio sistema de suministro de potencia; además, las empresas en las que invierte generalmente compran la potencia suministrada por su propia empresa a precios bajos del mercado."

En realidad, en la industria de la inteligencia computacional, formas como la vinculación de inteligencia computacional + inversión no son un caso aislado. Para muchos proveedores de capacidad de cálculo, "esta es actualmente una forma muy útil de consumir tarjetas, solo que no se ha puesto sobre la mesa." Feng Bo le dijo a Huxiu.

Sin embargo, en la historia anterior, este es un camino de consumo de potencia de cálculo "monopólico", es decir, los proveedores de potencia de cálculo aseguran la demanda de potencia de cálculo a través de inversiones y satisfacen directamente toda la demanda de potencia de cálculo del proyecto en el que invierten. Pero no es la única forma.

Feng Bo considera que hay otro modelo que merece atención: "los proveedores de capacidad de cálculo ingresan a los fondos de inversión con la identidad de LP, construyendo un modelo de cadena de demanda de capacidad de cálculo en un ciclo cerrado."

En concreto, este modelo de negocio presenta características de vinculación de capital: el proveedor de poder de cálculo A actúa como un socio limitado potencial (LP) y llega a un acuerdo de cooperación con el fondo industrial B. En el mapa de inversiones del fondo B, la empresa de aplicaciones de IA C es la empresa objetivo, y su desarrollo comercial tiene una demanda rígida de recursos de poder de cálculo. En este momento, A, a través de una inversión estratégica en el fondo B, vincula indirectamente la futura demanda de compra de poder de cálculo de la empresa C, construyendo un ciclo cerrado de "inversión de capital - compra de poder de cálculo".

Si la transacción se lleva a cabo, la empresa A obtendrá el derecho de servicio preferente gracias a su identidad de LP, convirtiéndose en el proveedor preferido para la compra de poder de cómputo de la empresa C. Este modelo, en esencia, crea un ciclo de flujo de capital: la inversión de la empresa A en el fondo B regresa finalmente a través de la compra de poder de cómputo de la empresa C.

“No es un método convencional, pero es una forma que todavía es bastante útil.” confesó Feng Bo.

03 La burbuja está a punto de estallar, ¿y ahora qué?

"Hablar de la burbuja de la inteligencia computacional no puede limitarse a la potencia de cálculo, es un problema de la cadena industrial. Para hacer que la potencia de cálculo se utilice, es necesario conectar los puntos que se han desconectado. Actualmente, esta cadena industrial aún no ha formado un ciclo cerrado." Un director de marketing de un proveedor de potencia de cálculo con muchos años en la industria señaló de manera perspicaz el núcleo del problema actual en la industria de la inteligencia computacional.

A medida que avanzamos hacia la primera mitad de 2025, una tendencia notable en el campo de la IA es que la palabra "preentrenamiento", que solía ser mencionada con frecuencia por las principales empresas de IA, está siendo gradualmente reemplazada por "inferencia". Ya sea en el amplio mercado de consumo B2C o en las aplicaciones empresariales B2B que empoderan a diversas industrias, la curva de crecimiento de la demanda de inferencia parece ser excepcionalmente pronunciada.

"No estaría de más hacer una simple proyección", estimó un analista de la industria, "calculando en función del volumen de las aplicaciones de IA más populares en el mercado, como Doubao, DeepSeek, etc., supongamos que cada usuario activo genera un promedio de 10 imágenes al día, la demanda de potencia de cálculo detrás de esto podría fácilmente alcanzar el nivel de cientos de millones de P. Esto es solo para el escenario único de generación de imágenes; si se superponen interacciones multimodales como texto, voz y video, la magnitud de la demanda es aún más difícil de estimar."

Esta es solo la demanda de inferencia para usuarios finales. Para los usuarios empresariales, la demanda de inferencia es aún masiva. Un alto ejecutivo de Huarui Zhikuan le dijo a Huxiu que la construcción de centros de inteligencia de cálculo por parte de los fabricantes de automóviles comienza desde escalas de decenas de miles de P, "y además, entre nuestros clientes, los que tienen la mayor demanda de capacidad de cálculo son precisamente los fabricantes de automóviles."

Sin embargo, al relacionar la enorme demanda de inferencias con la burbuja de poder de cómputo, la historia parece extremadamente absurda. ¿Por qué tanta demanda de inferencias todavía genera una burbuja de poder de cómputo?

Un proveedor de potencia de cálculo le dijo a Huxiu que una demanda de inferencia tan masiva requiere que los proveedores de servicios de inteligencia optimicen la potencia de cálculo mediante tecnología de ingeniería, como la compresión del tiempo de inicio, el aumento de la capacidad de almacenamiento, la reducción de la latencia de inferencia, el aumento del rendimiento y la precisión de la inferencia, entre otros.

No solo eso, el problema de desajuste entre la oferta y la demanda mencionado anteriormente también proviene en gran parte de los problemas con los chips. Al respecto, una fuente de la industria le dijo a Huxiu que la brecha entre algunas tarjetas nacionales y NVIDIA sigue siendo bastante grande, y su rendimiento se desarrolla de manera desigual. Incluso si se apilan muchas deficiencias en la misma marca, estas siguen existiendo, lo que lleva a que un solo clúster no pueda completar de manera efectiva el entrenamiento y la inferencia de la IA.

Este ‘efecto de limitación’ significa que, incluso al construir un clúster de potencia computacional mediante la apilación masiva de chips, si el problema de limitación no se resuelve de manera efectiva, la eficiencia general del clúster seguirá estando limitada, dificultando el soporte eficiente para el entrenamiento complejo y las tareas de inferencia a gran escala de modelos de IA.

De hecho, aunque los desafíos ingenieriles en el ámbito de la capacidad de procesamiento y los cuellos de botella de los chips son severos, muchas de las demandas de capacidad de procesamiento más profundas no se han satisfecho de manera efectiva, y su verdadero "punto de ruptura" a menudo aparece en el ecosistema de aplicaciones por encima de la capa de capacidad de procesamiento, especialmente en el grave vacío de los modelos verticales de la capa L2 (es decir, dirigidos a industrias o escenarios específicos).

En la industria médica existe un enorme "agujero" que necesita ser llenado, el efecto de succión de talento es un problema estructural que ha sido criticado durante mucho tiempo en el sistema médico nacional, donde los excelentes médicos se concentran en los hospitales de tercer nivel de las grandes ciudades. Sin embargo, cuando la industria espera que los grandes modelos médicos logren la descentralización de recursos médicos de calidad, surge un desafío más fundamental: ¿cómo construir un espacio de datos médicos confiable?

Porque para entrenar un gran modelo especializado que tenga la capacidad de diagnóstico y tratamiento de todo el curso de la enfermedad, los datos son una premisa clave. Pero el problema es que se necesita una gran cantidad de datos que abarque todo el curso de la enfermedad, todas las edades, todos los géneros y todas las regiones para formar conocimiento en el gran modelo. Y la realidad es que la tasa de apertura de datos médicos es inferior al 5%.

El director del departamento de información de un hospital de tercer nivel reveló que, de los 500 TB de datos de tratamiento generados anualmente por su hospital, menos del 3% son datos estructurados desensibilizados que realmente pueden ser utilizados para el entrenamiento de IA. Lo que es aún más grave es que los datos de enfermedades raras y crónicas, que representan el 80% del valor del mapa de enfermedades, han estado durmiendo durante mucho tiempo en las "islas de datos" de varias instituciones médicas debido a su sensibilidad.

Y puntos de ruptura como este no pueden resolverse, la cadena de suministro no podrá formar un ciclo cerrado. La demanda de poder de cálculo naturalmente no se satisfará, y está claro que esto ya ha superado con creces el ámbito que los proveedores de infraestructura de poder de cálculo, que solo ofrecen "tarjetas y electricidad", pueden afrontar de manera independiente.

Sin embargo, hoy en día ha surgido un grupo de nuevos proveedores de servicios de inteligencia computacional. Estas empresas ya no se limitan a posicionarse únicamente como proveedores de hardware o arrendadores de capacidad de cálculo, sino que también pueden formar equipos profesionales de algoritmos y de expertos en la industria, participando profundamente en el desarrollo y la optimización de aplicaciones de IA para los clientes.

Al mismo tiempo, frente a problemas como la descoordinación de recursos y la tasa de utilización de la potencia de cálculo, en diversas regiones se están implementando diferentes políticas de subsidios a la potencia de cálculo según las necesidades de la industria local, entre las cuales, los "vales de potencia de cálculo" se presentan como una modalidad de subsidio que reduce directamente los costos de uso de la potencia de cálculo para las empresas. Sin embargo, para la actual etapa de la industria de inteligencia computacional en China, es probable que un simple "medicamento de emergencia" político ya no sea suficiente para revertir fundamentalmente la situación.

Hoy en día, lo que necesita la industria de la inteligencia computacional es un ecosistema de "sangrado".

Ver originales
El contenido es solo de referencia, no una solicitud u oferta. No se proporciona asesoramiento fiscal, legal ni de inversión. Consulte el Descargo de responsabilidad para obtener más información sobre los riesgos.
  • Recompensa
  • Comentar
  • Compartir
Comentar
0/400
Sin comentarios
  • Anclado
Comercie con criptomonedas en cualquier lugar y en cualquier momento
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)