El desplazamiento del cuello de botella en la potencia de cálculo del clúster de 100,000 tarjetas AI: ¿Cómo se convierte la interconexión óptica en el núcleo de la nueva infraestructura?

Question

Durante los últimos dos años, las discusiones sobre la potencia de cálculo de IA se han centrado casi exclusivamente en las GPU: la brecha en el suministro del H100, los parámetros de rendimiento del B200, la hoja de ruta de la arquitectura de la próxima generación de GPU, conforman la narrativa principal de la industria. Sin embargo, cuando los clústeres de entrenamiento de IA pasan de miles a decenas de miles e incluso cientos de miles de tarjetas, una restricción estructural más profunda empieza a emerger: la eficiencia del flujo de datos entre GPUs, que está convirtiéndose en el techo final que determina la eficiencia general del clúster.

El arquitecto de redes ópticas de Tencent, Fu Sidong, señaló a principios de 2026 que, desde la arquitectura Pascal en 2016 hasta la arquitectura Blackwell en 2024, la potencia de cálculo de IA se ha multiplicado aproximadamente por 1000 en ocho años; la potencia de inferencia creció 32 veces en los últimos cuatro años, y la de entrenamiento 16 veces. Mientras tanto, el ancho de banda de la red aumentó de 200G a 800G, solo un 4 veces más. Este desequilibrio, donde la "potencia de cálculo se dispara como un cohete y la red avanza a paso lento", hace que la velocidad de transmisión de datos entre nodos se convierta en un cuello de botella clave en clústeres de decenas de miles o incluso cientos de miles de tarjetas, afectando gravemente la eficiencia y utilización de recursos del clúster en su conjunto.

Esta realidad está redefiniendo la lógica de inversión en infraestructura de IA y las opciones de ruta tecnológica. Cuando la tecnología de interconexión óptica evoluciona de una compensación de rendimiento local a una capacidad clave para soportar la operación a escala de clústeres de IA, comprender su lógica técnica, el panorama del mercado y el valor industrial se vuelve una cuestión fundamental e ineludible para evaluar la carrera de potencia de cálculo de IA. Al mismo tiempo, los inversores también están experimentando una transformación estructural similar: de una asignación de activos única a una colaboración multilateral en múltiples mercados, formando cadenas de valor que conectan la infraestructura de potencia de cálculo con la infraestructura financiera.

La paradoja de comunicación en clústeres de cien mil tarjetas: la brecha entre potencia y red

La eficiencia de un clúster de GPU no está determinada solo por el pico de potencia de cálculo de una GPU individual, sino por el tiempo necesario para que todas las GPUs colaboren en el cálculo. En el entrenamiento distribuido de modelos grandes, la sincronización frecuente de parámetros y el intercambio de gradientes hacen que la capacidad de comunicación entre nodos determine directamente la eficiencia total del entrenamiento. En su libro blanco sobre tecnología CPO, H3C señala que en los últimos años, la velocidad de mejora de la potencia de cálculo por tarjeta ha superado con creces la evolución del ancho de banda de interconexión de red, y que la mayoría de los clústeres aumentan continuamente la cantidad de GPUs en el lado de cálculo, pero la expansión del ancho de banda de comunicación ha sido relativamente lenta. Como resultado, el tiempo de comunicación representa cada vez más la proporción del tiempo total de entrenamiento, con GPUs esperando mucho tiempo a que lleguen los datos, dificultando que la potencia de cálculo efectiva total se escale proporcionalmente con la cantidad de GPUs.

Este fenómeno tiene una base cuantificable clara. Datos de presentaciones de Tencent muestran que, en los últimos cuatro años, la potencia de entrenamiento creció 16 veces, la de inferencia 32 veces, mientras que el ancho de banda de red solo aumentó de 200G a 800G, un crecimiento de 4 veces. Cuando el tamaño del clúster supera las diez mil tarjetas y evoluciona hacia cien mil, el modo de comunicación entre GPUs deja de ser simple transmisión punto a punto, para convertirse en un sistema complejo que involucra miles o incluso decenas de miles de enlaces operando simultáneamente. Cualquier congestión o retardo en un enlace puede retrasar todo el ciclo de iteración de entrenamiento.

Un artículo publicado en IEEE en febrero de 2026 confirma aún más esta conclusión: a medida que aumenta la escala de los modelos de IA, la interconexión se convierte en un cuello de botella crítico en grandes clústeres de GPU, y las redes tradicionales de conmutación por paquetes enfrentan desafíos cada vez mayores en términos de consumo de energía, costo y escalabilidad. La investigación muestra que las arquitecturas basadas en conmutación óptico-electrónica pueden reducir el consumo de energía del núcleo en casi un 99%, y disminuir en un 76% los costos de ciclo de vida en ocho años.

Desde los datos de la industria, esta contradicción estructural impulsa la expansión acelerada de la infraestructura de comunicaciones ópticas. UBS estima que, en los últimos cinco años, la demanda global de fibra óptica creció en promedio solo un 2% anual, pero con la aceleración de la construcción de centros de datos de IA, se espera que en los próximos años la demanda crezca más del 30% anual, con una tasa de crecimiento compuesta superior al 75% en la demanda de fibra óptica relacionada con centros de datos. Hasta ahora, entre el 70% y el 80% de la demanda de fibra proviene de operadores de telecomunicaciones; UBS prevé que para 2030, la proporción de demanda de empresas y centros de datos superará el 80%. La industria de fibra óptica está pasando de ser un componente de las telecomunicaciones tradicionales a convertirse en un elemento central de la infraestructura de IA.

Interconexión óptica: una ruta tecnológica determinista para resolver el cuello de botella de potencia

Frente a la brecha entre potencia y red, la tecnología de interconexión óptica está pasando de ser una solución complementaria a una opción fundamental en la arquitectura. La expansión de clústeres de IA generalmente se realiza en tres dimensiones: escalado vertical (Scale-up, interconexión de alta velocidad entre GPUs en un rack), escalado horizontal (Scale-out, interconexión entre racks en un clúster), y escalado transversal (Scale-across, conexión entre centros de datos geográficamente dispersos). Cada dimensión tiene diferentes requisitos en ancho de banda, latencia, consumo y distancia de transmisión, pero todas apuntan a la irreemplazabilidad de la interconexión óptica.

En escenarios de escalado vertical, la interconexión óptica reemplaza principalmente cables de cobre o conmutadores eléctricos, logrando mayor ancho de banda y menor latencia en la comunicación interna del nodo. Por ejemplo, el conmutador Ethernet Spectrum-X basado en CPO de NVIDIA soporta 512×200Gbps de capacidad de conmutación, con 32 motores ópticos de silicio de 1.6T para escenarios de escalado horizontal y transversal. El supernodo CloudMatrix 384 de Huawei utiliza una arquitectura de interconexión totalmente par a par, con 3,168 fibras ópticas y 6,912 módulos LPO de 400G, construyendo un bus de interconexión de alta velocidad que conecta y pool todos los recursos: 384 NPU, 192 CPU, almacenamiento y memoria.

En cuanto a la ruta tecnológica, las familias de tecnologías "x"PO, como LPO, LRO y CPO, están en rápida evolución. Datos de LightCounting muestran que el mercado global de módulos ópticos Ethernet crecerá un 35% en 2026 hasta 18.9 mil millones de dólares, y se espera que supere los 35 mil millones en 2030, dominado por módulos de alta velocidad como 800G y 1.6T. TrendForce estima que en 2026, la proporción de módulos ópticos de 800G o más en envíos globales superará el 60%, y considerando las aproximadamente 4 millones de unidades de TPU de Google en 2026, la demanda de módulos ópticos de más de 800G superará las 6 millones de unidades.

La gestión del consumo energético es uno de los principales desafíos de los módulos ópticos pluggables. La tecnología Apollo OCS de Google, que utiliza microespejos reflectantes para conectar directamente la fibra óptica, evita las conversiones repetidas entre óptico y eléctrico, reduciendo el consumo en aproximadamente un 95% en comparación con conmutadores tradicionales. En términos de latencia, el conjunto de chips sin DSP óptico de THine, compatible con LPO o CPO, puede reducir la latencia en un 90% y el consumo en un 73%.

El subdirector del Instituto de Investigación de Telecomunicaciones de China, Li Junjie, señaló a principios de 2026 que la tecnología de interconexión óptica está evolucionando de una compensación de rendimiento local a una capacidad clave para soportar operaciones a escala, flexible y altamente confiable en nodos de IA. Ya sea para resolver cuellos de botella en velocidad, restricciones de consumo o limitaciones de capacidad, la interconexión óptica se ha convertido en una condición previa para la evolución de la infraestructura de IA desde miles de tarjetas hasta cientos de miles.

La estrategia de Ciena: de banda ancha telecom a red óptica para IA

Cuando la interconexión óptica se convierte en la clave de la infraestructura de IA, la estrategia de los principales proveedores de equipos en este campo se vuelve una ventana importante para entender la evolución del sector. Ciena, proveedor líder mundial de sistemas de red de alta velocidad, está atravesando una transformación estratégica profunda.

En el tercer trimestre fiscal de 2025, Ciena reportó ingresos de 1,22 mil millones de dólares, impulsados principalmente por plataformas ópticas y de enrutamiento. Al mismo tiempo, anunció que dejará de desarrollar su negocio de PON de banda ancha, redirigiendo la inversión en I+D hacia soluciones centrales de óptica y centros de datos, incluyendo tecnologías de gestión fuera de banda, y recortando entre un 4% y un 5% de su plantilla, con una provisión de aproximadamente 90 millones de dólares en gastos de I+D no en efectivo. Ciena prevé que el crecimiento futuro provendrá principalmente de mercados de IA y grandes proveedores de la nube.

El CEO Gary Smith afirmó en la conferencia de resultados que los clientes proveedores de servicios están concentrando sus inversiones en áreas que puedan escalar para soportar el crecimiento del tráfico de IA, generando nuevas demandas de sistemas y oportunidades de interconexión, que finalmente se extienden a los centros de datos. Ciena indica que los grandes proveedores de la nube representan aproximadamente el 50% de su negocio, y que en 2026 su base de clientes será similar.

Ciena ya ha logrado resultados concretos en infraestructura de IA. La compañía apunta a un proyecto de infraestructura de IA en Norteamérica que conecta clústeres regionales de GPU en entrenamiento y distribución geográfica, incluyendo su plataforma RLS y el módulo WaveLogic 6 Nano 800-gig ZR. Además, su solución de gestión fuera de banda DCOM para centros de datos ayuda a simplificar la operación y gestión de grandes centros, mejorando la escalabilidad y reduciendo consumo y espacio.

Desde una perspectiva macro, el cambio estratégico de Ciena refleja un salto cualitativo en la demanda de redes ópticas en centros de datos de IA. Jürgen Hatheier, CTO de Ciena, señala que el mercado claramente se está moviendo hacia conexiones ópticas de mayor capacidad, con una fuerte demanda por longitudes de onda de 1.6T, y que esta tendencia continuará en 2026. Rob Shore, responsable de marketing de productos de redes ópticas de Nokia, prevé que en 2026 los módulos ópticos coherentes pluggables de 800G serán la solución estándar para conexiones ópticas en redes de IA.

El mercado de redes para centros de datos de IA está creciendo exponencialmente. Datos de la industria indican que este mercado pasará de 10,31 mil millones de dólares en 2025 a 12,8 mil millones en 2026, con una tasa de crecimiento anual compuesta del 24.2%, y alcanzará los 30,17 mil millones en 2030. La demanda de cables ópticos para IA se estima que crecerá un 77% en 2025 y tendrá una tasa de crecimiento anual compuesta del 26% hasta 2029, mucho más allá de las aplicaciones no relacionadas con IA. Ciena ocupa una posición central en esta curva de crecimiento estructural.

De infraestructura de potencia a infraestructura financiera: la visión de Gate en el mercado de acciones

La evolución de la infraestructura no solo ocurre en el nivel de potencia de cálculo, sino también en la asignación de activos. Cuando la interconexión óptica en centros de datos de IA se vuelve un factor decisivo en la eficiencia de los clústeres de GPU, la capacidad de asignación de activos en múltiples clases también requiere infraestructura eficiente para soportarla.

Gate avanza en su estrategia en el sector financiero tradicional. En enero de 2026, la plataforma lanzó por primera vez funciones de contratos por diferencia (CFD) en TradFi, cubriendo oro, divisas, índices bursátiles, commodities y acciones populares. En marzo, amplió a tokens de acciones y ETF apalancados. En junio, mediante una colaboración estratégica con Alpaca, lanzó oficialmente servicios de negociación de acciones reales.

Actualmente, Gate soporta más de 10,000 acciones y ETF estadounidenses, incluyendo empresas listadas en NYSE, NASDAQ y otros mercados principales, superando ampliamente las centenas de activos que suelen soportar plataformas tokenizadas de acciones. Los usuarios pueden invertir en los principales mercados estadounidenses usando USDT, con fracciones desde 0.01 acciones, permitiendo participar con montos tan bajos como 1 dólar en acciones líderes.

En términos tecnológicos y de colaboración, Gate se conecta con corredores regulados con licencia de Broker-Dealer y capacidad de compensación en EE. UU., accediendo a las principales bolsas como NYSE y NASDAQ. Cada acción está respaldada por activos reales custodiados de forma independiente en el sistema DTC, no por productos derivados en cadena o productos RWA. Los tenedores automáticos disfrutan de derechos completos como dividendos, ampliaciones y splits.

Desde la tendencia del sector, la integración de plataformas de criptomonedas con el comercio de acciones se vuelve una dirección clara. Datos muestran que el 73% de los traders de criptomonedas también poseen activos tradicionales. La estrategia de Gate, mediante infraestructura regulada, realiza operaciones reales en acciones, no solo representaciones sintéticas o tokenizadas, asegurando precios y liquidaciones reales. Combinado con sus productos CFD, Gate evoluciona de ser solo un exchange de activos criptográficos a un centro multiactivo que combina cripto y finanzas tradicionales y derivados.

Este avance también refleja la tendencia macro de tokenización de activos RWA. En septiembre de 2025, Gate lanzó la sección Ondo, introduciendo tokens de acciones y ETF de empresas como Apple, Tesla y Microsoft. La cantidad total de activos en RWA superó los 15.7 mil millones de dólares, con Ondo Finance como la tercera mayor en volumen bloqueado, con aproximadamente 1.66 mil millones. Desde acciones reales hasta acciones tokenizadas y CFDs, Gate construye una vía de asignación de múltiples niveles que cubre diversas formas de activos.

Conclusión

La trayectoria de la tecnología de interconexión óptica apunta claramente a un hecho fundamental: la competitividad de los centros de datos de IA se está desplazando de métricas de potencia de GPU a indicadores de eficiencia sistémica. La red ya no es solo un soporte accesorio del clúster de potencia, sino una condición previa para que un clúster de cien mil tarjetas pueda realmente desplegar su potencial teórico. En esta lógica, la valoración de las empresas de infraestructura de redes ópticas está siendo reevaluada por el mercado — la decisión de Ciena de enfocarse completamente en redes ópticas para IA es la prueba más evidente de esta tendencia.

Al mismo tiempo, la evolución de la infraestructura en el lado de la inversión tampoco puede ignorarse. Cuando la potencia de cálculo de IA se convierte en un elemento central de la producción digital, la capacidad de conectar eficazmente esa productividad con el capital global también está experimentando una migración sistémica. Desde potencia, red, hardware hasta activos, en la intersección de innovación tecnológica y financiera, suelen nacer oportunidades estructurales concentradas.

RWA-1,63%

ONDO-5,33%

TSLA-1,25%

Ver original

El desplazamiento del cuello de botella en la potencia de cálculo del clúster de 100,000 tarjetas AI: ¿Cómo se convierte la interconexión óptica en el núcleo de la nueva infraestructura?

La paradoja de comunicación en clústeres de cien mil tarjetas: la brecha entre potencia y red

Interconexión óptica: una ruta tecnológica determinista para resolver el cuello de botella de potencia

La estrategia de Ciena: de banda ancha telecom a red óptica para IA

De infraestructura de potencia a infraestructura financiera: la visión de Gate en el mercado de acciones

Conclusión

Temas de actualidad

GateIPOAccessSpaceX

AnthropicReleasesFable5Model

IsraelStrikesIranBTCPlunges

MyGateTradeStory

SpaceXIPOAttractsOver250BillionInOrders

Fijado