Básico
Spot
Opera con criptomonedas libremente
Margen
Multiplica tus beneficios con el apalancamiento
Convertir e Inversión automática
0 Fees
Opera cualquier volumen sin tarifas ni deslizamiento
ETF
Obtén exposición a posiciones apalancadas de forma sencilla
Trading premercado
Opera nuevos tokens antes de su listado
Contrato
Accede a cientos de contratos perpetuos
TradFi
Oro
Plataforma global de activos tradicionales
Opciones
Hot
Opera con opciones estándar al estilo europeo
Cuenta unificada
Maximiza la eficacia de tu capital
Trading de prueba
Introducción al trading de futuros
Prepárate para operar con futuros
Eventos de futuros
Únete a eventos para ganar recompensas
Trading de prueba
Usa fondos virtuales para probar el trading sin asumir riesgos
Lanzamiento
CandyDrop
Acumula golosinas para ganar airdrops
Launchpool
Staking rápido, ¡gana nuevos tokens con potencial!
HODLer Airdrop
Holdea GT y consigue airdrops enormes gratis
Launchpad
Anticípate a los demás en el próximo gran proyecto de tokens
Puntos Alpha
Opera activos on-chain y recibe airdrops
Puntos de futuros
Gana puntos de futuros y reclama recompensas de airdrop
Inversión
Simple Earn
Genera intereses con los tokens inactivos
Inversión automática
Invierte automáticamente de forma regular
Inversión dual
Aprovecha la volatilidad del mercado
Staking flexible
Gana recompensas con el staking flexible
Préstamo de criptomonedas
0 Fees
Usa tu cripto como garantía y pide otra en préstamo
Centro de préstamos
Centro de préstamos integral
Centro de patrimonio VIP
Planes de aumento patrimonial prémium
Gestión patrimonial privada
Asignación de activos prémium
Quant Fund
Estrategias cuantitativas de alto nivel
Staking
Haz staking de criptomonedas para ganar en productos PoS
Apalancamiento inteligente
Apalancamiento sin liquidación
Acuñación de GUSD
Acuña GUSD y gana rentabilidad de RWA
¿El ajuste en el sector de almacenamiento es un error de matanza o un colapso lógico?
Esta semana, un nuevo lanzamiento tecnológico de Google dejó atónido al sector de almacenamiento. Tomemos como ejemplo a Micron Technology, que experimentó cinco días consecutivos de pérdidas, y los activos relacionados en el mercado A también ajustaron sus precios.
TurboQuant, que afirma poder reducir la necesidad de almacenamiento de KV Cache de textos largos en seis veces y aumentar la velocidad de inferencia en ocho veces, provocó una caída en las acciones de almacenamiento tras su lanzamiento, y muchos gritaron que “la demanda de almacenamiento para IA se acabará”.
Pero si lo piensas detenidamente, ¿no te suena un poco familiar? Cuando apareció la tecnología GQA en 2023, también hubo quienes dijeron que la demanda de KV Cache se reduciría a la mitad y que el almacenamiento se enfriaría; cuando salió PagedAttention en 2024, el mismo discurso volvió a surgir.
¿Y qué pasó? En los últimos dos años, el consumo de tokens de los grandes modelos a nivel mundial aumentó más de diez veces, y la demanda de almacenamiento, en cambio, creció aún más.
01 La verdad sobre TurboQuant: la compresión no necesariamente es negativa
Muchos piensan que si hay una compresión de seis veces, entonces la demanda de almacenamiento se reduce en seis veces, ¿no sería eso fatal para las empresas de almacenamiento?
Si piensas así, has malinterpretado la lógica de esta tecnología.
En términos simples, KV Cache es la necesidad de almacenar el contenido de conversaciones previas durante la inferencia de un gran modelo; de lo contrario, olvidará lo que dijiste anteriormente. Esto representa la mayor parte de la demanda de almacenamiento en la fase de inferencia. La compresión que ofrece TurboQuant busca resolver el principal cuello de botella de la inferencia de IA: la pared de memoria.
Ahora, el contexto de los grandes modelos ha pasado de 4K a 128K, e incluso hay solicitudes de inferencia en niveles de millones y decenas de millones. Si no se realiza la compresión, incluso apilando toda la HBM disponible, no sería suficiente, y el costo de mover datos es mucho mayor que el costo de cálculo, lo que ralentiza significativamente la velocidad de inferencia.
Por lo tanto, la compresión se utiliza para permitir que la inferencia de contextos largos y alta concurrencia funcione, no para reducir un poco el almacenamiento.
Además, esto no es nada nuevo; la industria ya ha comenzado a iterar.
La GQA de 2023 comprimió el KV Cache de 4 a 8 veces; en 2024, la cuantificación y PagedAttention comprimieron entre 2 y 4 veces, y cada vez hubo quienes dijeron que la demanda de almacenamiento se acabaría. ¿Y qué pasó?
Después de cada compresión, todos se atreven a extender los contextos, a hacer más concurrencias. La inferencia de texto largo que antes no se podía permitir ahora es viable, y la nueva demanda llena el espacio que se ahorró con la compresión, incluso queda corto.
Esto es el efecto Jevons en economía; el ejemplo más típico es la compresión de video: cuando aparecieron H.264 y H.265, redujeron a la mitad la necesidad de almacenamiento por unidad de video, y en consecuencia, todos comenzaron a crear videos en 4K y 8K. Ahora, un video de diez minutos fácilmente ocupa más de 10GB, y al final, la demanda total de almacenamiento de video ha aumentado decenas de veces.
TurboQuant funciona de manera similar. Una compresión de seis veces parece considerable, pero echa un vistazo al crecimiento actual de la demanda: en febrero de 2026, el consumo de tokens de los grandes modelos a nivel mundial será diez veces mayor que en el mismo período del año pasado, y para 2028, la cantidad de datos globales alcanzará los 394ZB, más de cinco veces lo de 2020. Esta compresión es insignificante frente a un crecimiento de demanda exponencial.
Lo más importante es que la reducción de costos que trae la compresión liberará más nueva demanda.
Antes, la inferencia de contextos largos era demasiado costosa para muchas empresas, pero ahora, con la reducción de costos, se atreverán a usarla. Los proveedores de la nube también se atreverán a levantar las restricciones de contexto y concurrencia, y al final, la demanda total de almacenamiento se ampliará aún más.
En pocas palabras, TurboQuant es una optimización del lado de la oferta, no una desaparición del lado de la demanda. Es una optimización realizada para aliviar la pared de memoria en un contexto de suministro de HBM insuficiente.
A corto plazo, la brecha entre la oferta y la demanda de HBM sigue existiendo, e incluso, debido a la liberación de nueva demanda, esta brecha podría crecer aún más.
02 Un ciclo de auge prolongado choca con el cisne negro geopolítico
De hecho, antes de la volatilidad de TurboQuant, la industria del almacenamiento ya había entrado en un ciclo de auge superlativo, donde el equilibrio tenso entre oferta y demanda había alcanzado su punto máximo.
Del lado de la demanda, la explosión de la IA ha elevado la demanda de almacenamiento a niveles sin precedentes.
Antes, la demanda de almacenamiento dependía de PCs y teléfonos móviles; ahora, los servidores de IA y las aplicaciones multimodales se han convertido en nuevos motores.
El Seedance2.0 de Byte, que produce un video de diez minutos, consume decenas de veces más tokens que el texto, y la nueva arquitectura de Nvidia ha elevado la demanda de NAND de TB a PB, aumentando la capacidad de un solo gabinete cinco veces.
Los gigantes de Internet a nivel mundial están invirtiendo masivamente en infraestructura de computación; para 2026, el gasto de capital de los ocho principales CSP aumentará un 25%, alcanzando los 500 mil millones de dólares, y la mayor parte de este dinero se destina a la infraestructura de IA, donde el almacenamiento es una de las necesidades más críticas.
Mientras tanto, del lado de la oferta, los tres grandes fabricantes de almacenamiento en el extranjero, Samsung, SK Hynix y Micron, han restringido drásticamente la capacidad de producción.
Después de la pérdida de la última ronda de ciclos, ahora son muy cautelosos con la expansión de producción, y toda la nueva capacidad se destina a productos de alta gama como HBM y DDR5, mientras que la capacidad de DRAM y NAND de gama baja se está reduciendo.
Lo que es aún más problemático es que la capacidad de alta gama de HBM no se puede expandir.
Construir una sala limpia lleva de 8 a 12 meses, y el aumento de rendimiento toma aún más tiempo.
Actualmente, el inventario de las tres fábricas principales ha alcanzado un mínimo histórico de 3 a 5 semanas, lo que significa que después de agotar las existencias, la próxima producción aún no está lista, y la oferta ya se ha ajustado al máximo.
Este equilibrio tenso entre oferta y demanda ha llevado a que los precios de almacenamiento hayan aumentado durante varios meses.
El último informe financiero de Micron es la mejor prueba: en el FY26Q2, sus ingresos alcanzaron los 23.86 mil millones de dólares, un aumento del 196% interanual, y su beneficio neto fue de 14.021 mil millones, un aumento del 686%, con un margen de beneficio operativo alcanzando el 69%, lo que demuestra el poder de este ciclo superlativo.
Y justo en este momento, el conflicto en el estrecho de Ormuz ha agregado más tensión a esta oferta que ya estaba al límite.
Debes saber que la mayor parte de la capacidad de producción de almacenamiento global está en Corea del Sur, donde Samsung y SK Hynix representan el 70% de la capacidad de DRAM mundial, y Corea del Sur depende del Medio Oriente para el 70% de sus importaciones de petróleo, casi todo a través del estrecho de Ormuz.
Lo que es aún más crítico es que muchos de los gases raros necesarios para la producción de almacenamiento, como el helio, el 64.7% de Corea del Sur depende de Qatar, y la producción de helio en Qatar se ha detenido, recortando el 30% de la oferta global; además, la mayor parte del neón proviene de Irán, y ahora estos elementos se han convertido en bombas de tiempo en la cadena de suministro.
Esta es la situación actual en la industria del almacenamiento: la lógica a largo plazo es un ciclo de demanda superlativa impulsado por la IA, con una oferta rígida y precios en constante aumento; la lógica a corto plazo es el conflicto geopolítico en Ormuz, que ha golpeado directamente el punto crítico de la capacidad de almacenamiento en el extranjero, lo que hace que la oferta ya tensa sea aún más apretada.
03 ¿Quién puede aprovechar esta brecha de oferta global?
Muchos se preguntarán, ¿cuál es la oportunidad para el almacenamiento nacional en este momento? ¿Qué segmentos merecen más nuestra atención?
En realidad, es bastante simple, solo hay que centrarse en dos aspectos clave: primero, identificar aquellos segmentos de suministro en el extranjero que son más susceptibles a la interferencia geopolítica, y segundo, encontrar aquellos líderes nacionales que ya han logrado avances tecnológicos y están listos en términos de capacidad; solo ellos podrán aprovechar esta repentina brecha emergente.
Primero, están los segmentos de HBM y DRAM de alta gama.
Piensa en esto: la capacidad de Samsung y SK Hynix ya ha sido totalmente reservada por Nvidia. Si su capacidad enfrenta problemas debido a energía o materias primas, ¿quién suplirá esa brecha?
Por supuesto, los fabricantes de chips de almacenamiento nacionales en la parte superior de la cadena de suministro, que están rápidamente expandiendo su capacidad y ya han mejorado su rendimiento, también están invirtiendo en el desarrollo de HBM. Si hay problemas en la oferta extranjera, los clientes podrían acelerar la validación de los productos nacionales.
También está el segmento de módulos de almacenamiento en la parte media de la cadena de suministro.
Empresas como Jiangbolong y Baiwei Storage ya tienen canales de clientes establecidos. Si hay problemas en la oferta de obleas extranjeras y los precios suben, podrán ofrecer a los clientes productos de almacenamiento más estables y económicos utilizando la capacidad de obleas nacional.
En el pasado, todos pensaban que la cadena de suministro en el extranjero era muy estable, por lo que no estaban dispuestos a arriesgarse a cambiar a productos nacionales. Sin embargo, el conflicto geopolítico ha hecho sonar la alarma para todos: ¿acaso la cadena de suministro en el extranjero también puede interrumpirse? ¿Es tan arriesgado depender completamente de la capacidad exterior?
Además, el aumento en los precios del petróleo ha elevado los costos de las empresas extranjeras, lo que hace que la ventaja de costo de las empresas nacionales sea aún más evidente.
En resumen, la lógica a largo plazo del almacenamiento es un ciclo de demanda superlativa impulsado por la IA y una década de sustitución nacional; el catalizador a corto plazo es este conflicto geopolítico, que ha acelerado todo el proceso.
Sin embargo, dado que el sector ya ha experimentado un aumento considerable, lo que puede haber reflejado plenamente las expectativas optimistas del mercado, las futuras inversiones deben estar atentas a múltiples riesgos:
Riesgo de desarrollo de IA por debajo de las expectativas: Actualmente, la demanda de almacenamiento impulsada por la IA sigue creciendo. Si el avance de la tecnología de grandes modelos no cumple con las expectativas, no se puede descartar el riesgo de recortes en el gasto de capital de IA, lo que afectaría la demanda.
Riesgo de caída de precios de almacenamiento: Debido a la explosión de precios del almacenamiento, hay fenómenos de especulación y acaparamiento en los canales de distribución, y si la especulación afecta excesivamente la demanda de los sectores downstream, existe el riesgo de una caída de precios.
Riesgo de progreso en I+D por debajo de las expectativas: Las empresas de almacenamiento necesitan seguir actualizando e innovando sus productos, y si hay errores en la elección estratégica, puede haber riesgos de fracaso en la I+D.
04 Conclusión
Al mirar la historia de la industria del almacenamiento global, cada conflicto geopolítico acelera la reestructuración de la cadena de suministro; cada revolución tecnológica genera una nueva demanda de almacenamiento.
Y en este momento, nos encontramos en la intersección de la revolución de la IA y la reestructuración de la cadena de suministro, donde el almacenamiento es la pista central señalada por estas dos grandes olas.
Por supuesto, cualquier inversión en una pista no puede ser completamente fluida. La industria del almacenamiento sigue enfrentando riesgos como cambios en las políticas comerciales en el extranjero, intensificación de la competencia en la industria y retrasos en la innovación tecnológica, lo que requiere que sigamos rastreando continuamente los cambios en la industria, diferenciando lo verdadero de lo falso, y encontrando empresas que realmente posean una competencia central.