AI 数据中心为什么不能只依赖 GPU？内存、网络与存储的协同机制解析

Question

En junio de 2026, Bitcoin se mueve en torno a los 60,000 dólares, mientras que Ethereum se mantiene en el rango de los 1,600 dólares, con el mercado cripto en una fase de consolidación. Sin embargo, otro sector, la infraestructura de centros de datos de IA, muestra un nivel de actividad completamente diferente. Gartner predice que el gasto global en TI alcanzará los 6.31 billones de dólares en 2026, un aumento interanual del 13.5%, con el gasto en sistemas de centros de datos liderando todas las categorías con un crecimiento del 55.8%. IDC, por su parte, estima que el gasto empresarial global en IA alcanzará los 940 mil millones de dólares en 2026.

En esta carrera armamentística de capacidad de cómputo, se está produciendo un cambio cognitivo clave: la competitividad de un centro de datos de IA ya no depende únicamente de la cantidad de GPU y el pico de capacidad de cómputo, sino cada vez más de la capacidad de coordinación general del cómputo, almacenamiento y redes dentro del clúster. Comprender cómo la memoria, las redes y el almacenamiento trabajan juntos se ha convertido en una habilidad básica para evaluar el valor de inversión en infraestructura de IA.

Muro de memoria: el primer cuello de botella en la era de los grandes modelos

La escala de parámetros de los grandes modelos de IA ha experimentado un crecimiento exponencial en los últimos dos años. Entre 2024 y 2026, la cantidad de parámetros de los grandes modelos convencionales se ha multiplicado por cien, y la ventana de contexto se ha expandido de decenas de miles a millones de caracteres. Sin embargo, el ancho de banda de la memoria del servidor ha aumentado menos del 15% anual, muy por detrás del crecimiento del negocio de IA. Esta grave desproporción en las tasas de iteración de hardware y software ha convertido al "muro de memoria" en el cuello de botella central que limita la liberación de la capacidad de cómputo de IA.

El llamado muro de memoria es esencialmente la velocidad de mejora de la capacidad de cómputo de CPU/GPU que supera con creces la mejora del ancho de banda y la latencia de lectura/escritura de la memoria. Los chips de cómputo son extremadamente rápidos, pero el acceso a los datos no puede seguir el ritmo, lo que provoca que los procesadores pasen una gran cantidad de tiempo en estado de espera. Según informes de pruebas de la industria, en clústeres de decenas de miles de tarjetas, el cuello de botella de E/S de datos puede provocar que el tiempo de espera vacía de las GPU supere el 40%, lo que significa que casi la mitad del tiempo, los costosos chips de cómputo están esperando la transferencia de datos.

La escasez de recursos de memoria también es alarmante. El consumo de DRAM y HBM de un solo servidor de inferencia de IA es más de diez veces mayor que el de un servidor de centro de datos tradicional, y casi el 60% de la capacidad de producción de obleas de DRAM a nivel mundial ya está ocupada por clústeres de IA. HBM ha estado en un estado de escasez y pedidos bloqueados durante mucho tiempo, y la mayor parte de la capacidad de producción ha sido bloqueada por grandes clientes hasta 2026 o incluso 2027. Gartner señala que la fuerte demanda, combinada con los cuellos de botella de suministro, ha llevado los precios de HBM a máximos históricos, y el rápido aumento de los precios ha convertido a la memoria en un área de alto margen para los fabricantes de semiconductores.

Para romper el muro de memoria, la industria avanza en dos frentes: uno es la programación refinada y la optimización de compresión a nivel de software, mediante técnicas como la programación jerárquica de caché KV y la cuantización de baja precisión para revitalizar los recursos de almacenamiento existentes; el otro es la reestructuración de la arquitectura a nivel de hardware, incluida la iteración de HBM y la implementación de nuevos protocolos de interconexión de memoria como CXL (Compute Express Link). La nueva plataforma HGX Rubin de NVIDIA ya ha triplicado el ancho de banda de la memoria GPU a 176 TB/s. Estas dos vías no son sustitutivas, sino soluciones complementarias para que toda la cadena industrial redefina la lógica de colaboración entre almacenamiento y cómputo.

Redes: el "sistema nervioso" de los clústeres de IA

Si la memoria resuelve la eficiencia de la transferencia de datos dentro de un solo nodo, las redes resuelven el problema del flujo de datos entre nodos. En un clúster de IA a gran escala, cientos o miles de GPU deben colaborar para completar una tarea de entrenamiento o inferencia de un modelo, y la eficiencia de la comunicación entre GPU afecta directamente la velocidad general del entrenamiento.

El cuello de botella de ancho de banda actual es de múltiples niveles: entre chips, la interconexión tradicional basada en PCB ya no puede satisfacer las necesidades de alto ancho de banda y baja latencia de los chips de IA; dentro del gabinete, el ancho de banda de interconexión entre servidores se convierte en una limitación para la expansión vertical; entre centros de datos, el ancho de banda y la latencia de transmisión de larga distancia limitan la eficiencia de la expansión horizontal y la programación de recursos de cómputo entre regiones. Según estimaciones, en los clústeres de entrenamiento de IA actuales, el consumo de energía de la transferencia de datos ya supera el del propio cómputo.

NVLink e InfiniBand de NVIDIA han dominado durante mucho tiempo el mercado de interconexión interna de clústeres de IA. Su último ancho de banda de conmutador NVLink ha alcanzado los 28.8 TB/s, el doble que la generación anterior. Sin embargo, este panorama está siendo desafiado: fabricantes como AMD y Broadcom están impulsando sus propios esquemas de interconexión, y estándares abiertos como UALink (Ultra Accelerator Link) también se están acelerando. En 2026, el sector de redes ha pasado de ser "exclusivo de NVIDIA" a una "competencia de múltiples estándares", lo que plantea mayores requisitos para la capacidad de integración de sistemas de los operadores de centros de datos.

Almacenamiento: de "almacén" a "tubería de datos"

En los centros de datos tradicionales, el rol del almacenamiento era el de un "almacén de datos", principalmente para la conservación y archivado de datos fríos. Pero en los centros de datos de IA, el rol del almacenamiento ha evolucionado hacia una "tubería de datos", que necesita suministrar datos de entrenamiento a los nodos de cómputo a altísimas velocidades y admitir la lectura de parámetros del modelo con baja latencia en escenarios de inferencia.

El entrenamiento de IA requiere la lectura de alta velocidad de grandes cantidades de datos sin procesar, mientras que la inferencia requiere un acceso rápido a los pesos del modelo y a la caché KV. La caché KV ha comenzado a extenderse desde la HBM de la GPU a la DRAM del sistema, e incluso más abajo, a los SSD de alta velocidad locales. Esto significa que la frontera entre almacenamiento y memoria se está desdibujando; los dispositivos de almacenamiento ya no son solo el destino final de los datos, sino nodos clave en la tubería de flujo de datos.

El almacenamiento totalmente flash está reemplazando a los discos duros mecánicos tradicionales como la opción principal para los centros de datos de IA. Los productos de almacenamiento totalmente flash y de interconexión de red nativa de alta velocidad mostrados por Sugon en ISC High Performance 2026 son un ejemplo industrial de esta tendencia. El rendimiento del almacenamiento determina directamente si los datos pueden llegar a las unidades de cómputo a tiempo, y por lo tanto, la tasa de utilización de las GPU.

Coordinación "cómputo-almacenamiento-red": de la mejora puntual a la optimización del sistema

Una vez que se comprenden los roles y cuellos de botella de cada uno, el significado de "coordinación" se vuelve claro: la capacidad de cómputo real de un centro de datos de IA no es la simple suma de la capacidad de cómputo de las GPU, el ancho de banda de la memoria, el rendimiento de la red y las IOPS de almacenamiento, sino la salida efectiva después de acoplar estos cuatro elementos a nivel de sistema.

El continuo crecimiento de los parámetros de los grandes modelos ha dado lugar a superclústeres de IA. La facilidad de uso de la capacidad de cómputo ya no depende únicamente del rendimiento del chip, sino cada vez más de la capacidad de coordinación y eficiencia general del cómputo, almacenamiento y redes dentro del clúster. Esta evaluación se está convirtiendo en un consenso en la industria.

Desde la perspectiva de la práctica industrial, el diseño de acoplamiento estrecho "cómputo-almacenamiento-red" se ha convertido en el estándar para los fabricantes líderes. El superclúster scaleX AI de Sugon se adhiere a este concepto de diseño de acoplamiento estrecho, mejorando significativamente la eficiencia de entrenamiento e inferencia. El sistema operativo de inferencia Dynamo 1.0 de NVIDIA, combinado con la plataforma BlueField-4 CMX, conecta múltiples capas de medios, incluyendo GPU, HBM, DRAM del host, flash local y almacenamiento remoto, utilizando la división automática de datos fríos y calientes para romper el aislamiento de memoria de una sola tarjeta.

En un informe de junio de 2026, IDC señala claramente que la ventaja competitiva en el campo de la IA se ha desplazado: la clave ya no es poseer la capacidad de cómputo más fuerte, sino cómo convertir la IA en una capacidad empresarial sostenible al menor costo de Token. Y el componente central del costo de Token es la eficiencia combinada de cómputo, memoria, redes y almacenamiento.

Panorama del mercado: ¿quién se beneficia?

Esta tendencia industrial ya se ha reflejado plenamente en el mercado de capitales.

En el lado de la memoria, SK Hynix es sin duda el activo más brillante en 2026. El 22 de junio de 2026, las acciones de SK Hynix se dispararon un 6%, alcanzando un máximo histórico de 2,944,000 wones, superando a Samsung para convertirse en la empresa con mayor capitalización de mercado en la bolsa de Corea del Sur, con una ganancia acumulada en lo que va del año de más del 349%. Micron también ha mostrado un rendimiento sólido; en la última semana de junio, sus resultados trimestrales mostraron que los ingresos se cuadruplicaron interanualmente, y anunció 16 acuerdos de suministro a largo plazo. Las acciones de Micron subieron un 16% el día de la publicación de resultados.

En el lado de las redes, las acciones de Corning, proveedor de productos de fibra óptica, alcanzaron un máximo histórico en la última semana de junio. La posición clave de sus productos de fibra óptica en los centros de datos de IA está siendo revalorizada por el mercado. Los pedidos de infraestructura de IA de Cisco ya superan los 9 mil millones de dólares.

En el lado de servidores e integración de sistemas, los ingresos trimestrales de servidores optimizados para IA de Dell alcanzaron los 16.1 mil millones de dólares, un aumento del 757% interanual. Supermicro posee aproximadamente el 70% de la cuota de mercado en tecnología de refrigeración líquida directa.

En el lado de operación de centros de datos, BOCOM International ha clasificado a GDS-SW y SUNEVISION como las principales opciones de compra en el sector de centros de datos, considerando que la IA generativa ha desencadenado un crecimiento explosivo de la demanda. UBS también señala que la industria de centros de datos de Internet de China comenzará a acelerarse significativamente a partir de la segunda mitad de 2026.

¿Cómo participar en la inversión en infraestructura de IA a través de la plataforma Gate?

La plataforma Gate ya ha listado más de 12,500 acciones y ETF en mercados como EE. UU., Hong Kong y Corea del Sur. Los inversores pueden utilizar activos digitales como USDT a través de una cuenta unificada para participar directamente en la negociación de acciones globales, logrando una asignación combinada de activos cripto y valores tradicionales.

En el ámbito de la infraestructura de centros de datos de IA, Gate cubre objetivos de toda la cadena industrial, desde chips hasta aplicaciones:

En acciones de EE. UU., los inversores pueden negociar empresas principales como NVIDIA (NVDA), AMD, Micron (MU), Broadcom (AVGO), Dell (DELL), Supermicro (SMCI), Corning (GLW) y Cisco (CSCO). Gate admite la negociación antes y después del horario de mercado, con un horario de negociación extendido a 16×5, lo que permite a los usuarios responder más rápidamente a los informes de resultados y datos macroeconómicos.

En acciones de Hong Kong, se puede prestar atención a operadores de centros de datos como GDS (09698.HK) y SUNEVISION (01686.HK).

En acciones de Corea del Sur, SK Hynix (000660.KS) es el líder absoluto en el campo de HBM; Jeju Semiconductor desempeña un papel clave como proveedor upstream de materiales de comunicación óptica para centros de datos de IA.

La negociación de acciones en Gate admite una tasa de comisión tan baja como 0.1%, operaciones apalancadas y modo spot dual. Los usuarios con una cartera de 2,000 dólares pueden disfrutar de tasas VIP exclusivas. Para los inversores que desean asignar sistemáticamente en el sector de infraestructura de centros de datos de IA, la capacidad de negociación integral de Gate en múltiples mercados y activos está reduciendo las barreras para la asignación de activos tecnológicos globales.

Conclusión

Los centros de datos de IA están pasando de la era tosca de "apilar GPU" a la era refinada de "optimización del sistema". La memoria, las redes y el almacenamiento ya no son componentes de infraestructura aislados, sino variables del sistema que, dentro del marco de coordinación "cómputo-almacenamiento-red", determinan conjuntamente la producción real de la capacidad de cómputo de IA.

Comprender esta lógica no solo ayuda a evaluar las tendencias tecnológicas, sino que también proporciona un marco de análisis más sólido para las decisiones de inversión: desde chips hasta memoria, desde redes hasta almacenamiento, desde servidores hasta operación de centros de datos, la revalorización de toda la cadena industrial apenas comienza. Y cuando la volatilidad a corto plazo del mercado cripto converge con la narrativa a largo plazo de la infraestructura de IA, se abre una ventana de asignación que abarca tanto activos digitales como industrias físicas.

FAQ

Q1: ¿Por qué los centros de datos de IA no pueden resolver el problema de la capacidad de cómputo simplemente apilando GPU?

La GPU es solo el terminal de salida de la capacidad de cómputo, y su eficiencia depende en gran medida de si el ancho de banda de la memoria puede suministrar datos a tiempo, si la red puede coordinar eficientemente el paralelismo de múltiples tarjetas y si el almacenamiento puede responder rápidamente a las lecturas y escrituras masivas de datos. En clústeres de decenas de miles de tarjetas, el cuello de botella de E/S de datos puede provocar que el tiempo de espera vacía de las GPU supere el 40%; simplemente acumular GPU sin resolver la coordinación de estos tres elementos resulta en un desperdicio asombroso de capacidad de cómputo.

Q2: ¿Por qué hay tanta escasez de HBM?

HBM (Memoria de alto ancho de banda) es la memoria estándar para los chips de IA, con un proceso de fabricación complejo y un ciclo de expansión de capacidad de más de dos años. En 2026, la demanda de inferencia de IA superó al entrenamiento, lo que impulsó aún más la demanda de HBM y DRAM de alta capacidad. La mayor parte de la capacidad de producción ya ha sido bloqueada por grandes clientes hasta 2026 o incluso 2027, y la elasticidad de la oferta a corto plazo es extremadamente limitada.

Q3: ¿Cuál es la lógica central de la inversión en infraestructura de centros de datos de IA?

La lógica central es pasar de un "entrenamiento dominante" a una "explosión de demanda de pila completa". Microsoft, Google, Amazon y Meta, los cuatro gigantes tecnológicos, tendrán un gasto de capital combinado en infraestructura de IA de 725 mil millones de dólares en 2026. Este nivel de gasto no puede ser soportado por un solo eslabón; toda la cadena industrial, desde chips, memoria, redes hasta operación de centros de datos, se encuentra en un ciclo de beneficios estructurales.

Q4: ¿Cómo negociar acciones relacionadas con la infraestructura de IA en la plataforma Gate?

Gate ya ha listado más de 12,500 acciones y ETF en los mercados de EE. UU., Hong Kong y Corea del Sur. Los usuarios pueden depositar fondos utilizando activos digitales como USDT y negociar en una cuenta unificada objetivos principales de infraestructura de IA como NVIDIA, Micron y SK Hynix, con soporte para negociación antes y después del horario de mercado, modo de apalancamiento y spot, y una tasa de comisión tan baja como 0.1%.

Q5: ¿Cuáles son los riesgos de inversión en infraestructura de centros de datos de IA?

Los principales riesgos incluyen: primero, un desajuste entre oferta y demanda que puede llevar a un exceso cíclico; BOCOM International señala que se debe prestar atención a posibles desajustes cíclicos y fluctuaciones de valoración a largo plazo. Segundo, la sostenibilidad del gasto de capital de los proveedores de servicios en la nube a gran escala; JPMorgan señala que la tasa de crecimiento del gasto de capital entre 2025 y 2026 supera con creces la tasa de crecimiento de los ingresos reales, lo que genera presión sobre el flujo de caja. Tercero, la geopolítica y los controles de exportación que afectan la cadena de suministro de chips de proceso avanzado.

BTC-1,00%

ETH0,46%

AI 数据中心为什么不能只依赖 GPU？内存、网络与存储的协同机制解析

Muro de memoria: el primer cuello de botella en la era de los grandes modelos

Redes: el "sistema nervioso" de los clústeres de IA

Almacenamiento: de "almacén" a "tubería de datos"

Coordinación "cómputo-almacenamiento-red": de la mejora puntual a la optimización del sistema

Panorama del mercado: ¿quién se beneficia?

¿Cómo participar en la inversión en infraestructura de IA a través de la plataforma Gate?

Conclusión

FAQ

Temas de actualidad

SKHynixTopsKOSPIByMarketCap

GateCompletesDividendDistribution

IsraelStrikesIranBTCPlunges

PredictWorldCupShare20000U

SolanaEcosystemANSEMSurges

Fijado