Por que os data centers de IA não podem depender apenas de GPUs? Análise dos mecanismos de coordenação entre memória, rede e armazenamento.

Em junho de 2026, o Bitcoin oscila perto da marca de 60.000 dólares, o Ethereum se mantém na faixa de 1.600 dólares, e o mercado de criptomoedas está em uma fase de consolidação de fundo. Mas outro setor — a infraestrutura de data centers de IA — apresenta um nível de entusiasmo completamente diferente. A Gartner prevê que os gastos globais com TI em 2026 atingirão US$ 6,31 trilhões, um aumento de 13,5% ano a ano, com os gastos com sistemas de data centers liderando todas as categorias com um crescimento de 55,8%. Já a IDC projeta que os gastos globais das empresas com IA chegarão a US$ 940 bilhões em 2026.

Nessa corrida armamentista computacional, uma mudança crucial de percepção está ocorrendo: a competitividade de um data center de IA não depende mais apenas da quantidade de GPUs e do pico de poder computacional, mas cada vez mais da capacidade de coordenação geral entre computação, armazenamento e rede dentro do cluster. Compreender como Memory (memória), Networking (rede) e Storage (armazenamento) funcionam em conjunto tornou-se o fundamento para avaliar o valor do investimento em infraestrutura de IA.

Parede de memória: o primeiro gargalo da era dos grandes modelos

A escala de parâmetros dos grandes modelos de IA experimentou um crescimento exponencial nos últimos dois anos. De 2024 a 2026, o número de parâmetros dos grandes modelos mainstream aumentou cem vezes, e a janela de contexto se expandiu de dezenas de milhares de caracteres para milhões de caracteres. No entanto, o aumento anual da largura de banda da memória do servidor é inferior a 15%, muito aquém da taxa de crescimento dos negócios de IA. Esse grave descompasso na taxa de atualização entre software e hardware faz com que a "parede de memória" se torne o gargalo central que restringe a liberação do poder computacional de IA.

A chamada parede de memória é essencialmente o fato de que a velocidade de melhoria da capacidade computacional de CPUs/GPUs supera em muito a velocidade de melhoria da largura de banda de leitura/escrita e da latência da memória. Os chips computacionais operam extremamente rápido, mas o acesso aos dados não consegue acompanhar, fazendo com que o processador fique ocioso e em espera por um longo período. De acordo com relatórios de testes do setor, em clusters com dezenas de milhares de GPUs, o gargalo de I/O de dados pode levar a um tempo de espera ocioso das GPUs de mais de 40% — o que significa que chips computacionais caros passam quase metade do tempo esperando a movimentação de dados.

A escassez de recursos de memória também é alarmante. O consumo de DRAM e HBM de um único servidor de inferência de IA é mais de dez vezes o de um servidor tradicional de data center, e quase 60% da capacidade de produção global de wafers de DRAM já está ocupada por clusters de IA. O HBM, em particular, está em estado de bloqueio de pedidos e escassez por um longo período, com sua principal produção já garantida por grandes clientes até 2026 ou mesmo 2027. A Gartner aponta que a forte demanda combinada com gargalos de oferta fez com que os preços do HBM atingissem recordes históricos, e o rápido aumento de preços tornou a memória uma área de altos lucros para os fabricantes de semicondutores.

Para romper a parede de memória, a indústria está avançando em duas frentes: uma é o refinamento do agendamento em nível de software e a otimização de compressão, revitalizando recursos de armazenamento existentes por meio de tecnologias como agendamento hierárquico de cache KV e compressão de quantização de baixo bit; a outra é a reconstrução arquitetônica em nível de hardware, incluindo a iteração de HBM e a implementação de novos protocolos de interconexão de memória como CXL (Compute Express Link). A nova plataforma HGX Rubin da NVIDIA já aumentou a largura de banda da memória da GPU em 3 vezes, para 176 TB/s. Esses dois caminhos não são substitutos, mas sim soluções complementares que reconfiguram a lógica de colaboração entre armazenamento e poder computacional em toda a cadeia.

Rede: o "sistema nervoso" dos clusters de IA

Se a memória resolve a eficiência da movimentação de dados dentro de um único nó, a rede resolve o fluxo de dados entre nós. Em clusters de IA de grande escala, centenas ou milhares de GPUs precisam colaborar para completar uma tarefa de treinamento ou inferência de um modelo, e a eficiência da comunicação entre GPUs impacta diretamente a velocidade geral do treinamento.

O gargalo atual de largura de banda é em vários níveis: entre chips, a interconexão tradicional em PCB já não consegue atender às necessidades de alta largura de banda e baixa latência dos chips de IA; dentro do rack, a largura de banda de interconexão entre servidores se torna uma restrição para a expansão vertical; entre data centers, a largura de banda e a latência de transmissão de longa distância limitam a expansão horizontal e a eficiência do agendamento computacional entre regiões. Estima-se que, em clusters atuais de treinamento de IA, o consumo de energia para movimentação de dados já superou o consumo de energia da computação em si.

O NVLink e o InfiniBand da NVIDIA dominam há muito tempo o mercado de interconexão interna de clusters de IA. A largura de banda do seu mais recente NVLink Switch atingiu 28,8 TB/s, o dobro da geração anterior. Mas esse cenário está sendo desafiado — fabricantes como AMD e Broadcom estão promovendo suas próprias soluções de interconexão, e padrões abertos como UALink (Ultra Accelerator Link) também estão se consolidando rapidamente. Em 2026, o setor de rede passou de "exclusividade da NVIDIA" para "competição de múltiplos padrões", o que impõe exigências mais altas à capacidade de integração de sistemas dos operadores de data centers.

Armazenamento: de "depósito" a "duto de dados"

Em data centers tradicionais, o papel do armazenamento era o de "depósito de dados" — principalmente para preservação e arquivamento de dados frios. Mas, em data centers de IA, o papel do armazenamento foi atualizado para "duto de dados" — ele precisa fornecer continuamente dados de treinamento em altíssima velocidade para os nós computacionais e, em cenários de inferência, suportar leitura de parâmetros de modelo com baixa latência.

O treinamento de IA requer leitura em alta velocidade de grandes volumes de dados brutos, enquanto a inferência requer acesso rápido aos pesos do modelo e ao cache KV. O cache KV começou a se estender da HBM da GPU para a DRAM do sistema e, em seguida, para SSDs locais de alta velocidade. Isso significa que as fronteiras entre armazenamento e memória estão se tornando difusas. Os dispositivos de armazenamento não são mais apenas o ponto final dos dados, mas sim nós-chave no duto de fluxo de dados.

O armazenamento totalmente flash está substituindo os discos rígidos mecânicos tradicionais como a escolha mainstream para data centers de IA. Os produtos de armazenamento totalmente flash e rede de interconexão nativa de alta velocidade exibidos pela Sugon no ISC High Performance 2026 são um reflexo industrial dessa tendência. O desempenho do armazenamento determina diretamente se os dados podem ser entregues às unidades de computação em tempo hábil, impactando assim a taxa de utilização das GPUs.

Coordenação "computação-armazenamento-rede": da otimização de pontos isolados à otimização do sistema

Depois de compreender os papéis e gargalos de cada um dos três, o significado de "coordenação" fica claro: o poder computacional real de um data center de IA não é a simples soma do poder computacional da GPU, da largura de banda da memória, da taxa de transferência da rede e dos IOPS de armazenamento, mas sim a saída efetiva após o acoplamento sistêmico dos quatro.

O crescimento contínuo dos parâmetros dos grandes modelos está gerando superclusters de IA. A usabilidade do poder computacional não depende mais apenas do desempenho do chip, mas cada vez mais da capacidade e eficiência de coordenação geral entre computação, armazenamento e rede dentro do cluster. Esse entendimento está se tornando um consenso na indústria.

Do ponto de vista da prática industrial, o design de acoplamento estreito "computação-armazenamento-rede" tornou-se o padrão dos fabricantes líderes. O supercluster scaleX AI da Sugon adota o conceito de design de acoplamento estreito entre computação, armazenamento e rede, melhorando significativamente a eficiência de treinamento e inferência. O sistema operacional de inferência Dynamo 1.0 da NVIDIA, combinado com a plataforma BlueField-4 CMX, interliga múltiplas camadas de mídia — GPU, HBM, DRAM do host, flash local e armazenamento remoto —, quebrando o isolamento da memória de cada placa de vídeo por meio da distribuição automática de dados quentes e frios.

A IDC, em seu relatório de junho de 2026, apontou claramente que a vantagem competitiva no campo da IA mudou: o foco não é mais ter o poder computacional mais forte, mas sim como converter IA em capacidade de negócios sustentável com o menor custo por Token. E o custo central do Token é exatamente a eficiência combinada de computação, memória, rede e armazenamento.

Cenário de mercado: quem está se beneficiando?

Essa tendência industrial já se refletiu plenamente no mercado de capitais.

No lado da memória, a SK Hynix é, sem dúvida, o ativo mais brilhante em 2026. Em 22 de junho de 2026, as ações da SK Hynix dispararam 6%, atingindo a máxima histórica de 2.944.000 won sul-coreanos, superando a Samsung para se tornar a maior empresa de capitalização de mercado da bolsa sul-coreana, com um ganho acumulado no ano de mais de 349%. A Micron também teve um desempenho forte. Em seu relatório trimestral da última semana de junho, a receita mais que quadruplicou em relação ao ano anterior, e a empresa anunciou 16 acordos de fornecimento de longo prazo. As ações da Micron dispararam 16% no dia da divulgação do relatório.

No lado da rede, as ações da Corning, fornecedora de produtos de fibra óptica, atingiram uma máxima histórica na última semana de junho. A posição crucial de seus produtos de fibra óptica em data centers de IA está sendo reavaliada pelo mercado. Os pedidos de infraestrutura de IA da Cisco já ultrapassaram US$ 9 bilhões.

No lado dos servidores e integração de sistemas, a receita trimestral de servidores otimizados para IA da Dell atingiu US$ 16,1 bilhões, um aumento de 757% em relação ao ano anterior. A Supermicro detém cerca de 70% do mercado de tecnologia de refrigeração líquida direta.

No lado da operação de data centers, o BOCOM International listou a GDS-SW e a SUNEVISION como as principais recomendações de compra no setor de data centers, acreditando que a IA generativa já desencadeou um crescimento explosivo na demanda. O UBS também apontou que a indústria chinesa de data centers começará a acelerar significativamente a partir do segundo semestre de 2026.

Como participar do investimento em infraestrutura de IA através da plataforma Gate?

A plataforma Gate já listou mais de 12.500 ações e ETFs nos mercados dos EUA, Hong Kong e Coreia do Sul. Os investidores podem usar uma conta unificada com ativos digitais como USDT para negociar ações globais diretamente, realizando uma alocação unificada de ativos criptográficos e títulos tradicionais.

No campo da infraestrutura de data centers de IA, a Gate cobre toda a cadeia, desde chips até aplicações:

No mercado de ações dos EUA, os investidores podem negociar empresas-chave como NVIDIA (NVDA), AMD, Micron (MU), Broadcom (AVGO), Dell (DELL), Supermicro (SMCI), Corning (GLW) e Cisco (CSCO). A Gate suporta negociação pré-mercado e pós-mercado, com horário de negociação estendido para 16×5, permitindo que os usuários respondam mais rapidamente aos relatórios financeiros e dados macroeconômicos.

No mercado de Hong Kong, pode-se prestar atenção a operadoras de data centers como GDS-SW (09698.HK) e SUNEVISION (01686.HK).

No mercado sul-coreano, a SK Hynix (000660.KS) é a líder absoluta no campo de HBM; já a Jeju Semiconductor desempenha um papel crucial upstream no fornecimento de materiais de comunicação óptica para data centers de IA.

A negociação de ações na Gate suporta taxas tão baixas quanto 0,1%, negociação alavancada e modo duplo (spot e derivativos). Usuários com saldo de US$ 2.000 podem desfrutar de taxas VIP exclusivas. Para investidores que desejam alocar sistematicamente no setor de infraestrutura de data centers de IA, a capacidade de negociação unificada entre mercados e ativos múltiplos oferecida pela Gate está reduzindo a barreira para a alocação global de ativos de tecnologia.

Conclusão

Os data centers de IA estão saindo da era intensiva de "empilhar GPUs" para a era refinada de "otimização do sistema". Memória, rede e armazenamento não são mais componentes de infraestrutura isolados, mas sim variáveis sistêmicas que, sob a estrutura de coordenação "computação-armazenamento-rede", determinam conjuntamente a saída real de poder computacional de IA.

Compreender essa lógica não só ajuda a avaliar as tendências tecnológicas, mas também fornece uma estrutura de análise mais sólida para decisões de investimento — de chips a memória, de rede a armazenamento, de servidores a operação de data centers, a reavaliação de valor de toda a cadeia industrial está apenas começando. E quando a volatilidade de curto prazo do mercado de criptomoedas se encontra com a narrativa de longo prazo da infraestrutura de IA, uma janela de alocação que atravessa ativos digitais e indústrias físicas está se abrindo.

FAQ

Q1: Por que os data centers de IA não podem resolver o problema de poder computacional apenas empilhando GPUs?

GPU é apenas o terminal de saída de poder computacional. Sua eficácia depende fortemente de se a largura de banda da memória pode fornecer dados em tempo hábil, se a rede pode coordenar eficientemente o paralelismo de múltiplas placas e se o armazenamento pode responder rapidamente a leituras e escritas de grandes volumes de dados. Em clusters com dezenas de milhares de GPUs, o gargalo de I/O de dados pode levar a um tempo de espera ocioso das GPUs de mais de 40% — simplesmente empilhar GPUs sem resolver a coordenação desses três elementos resulta em um enorme desperdício de poder computacional.

Q2: Por que o HBM é tão escasso?

HBM (Memória de Alta Largura de Banda) é a memória padrão para chips de IA. Seu processo de fabricação é complexo e o ciclo de expansão de capacidade é de mais de dois anos. Em 2026, a demanda de inferência de IA superou os cenários de treinamento, impulsionando ainda mais a demanda por HBM e DRAM de alta capacidade. A maior parte da produção já foi garantida por grandes clientes até 2026 ou mesmo 2027, com elasticidade de oferta de curto prazo extremamente limitada.

Q3: Qual é a lógica central do investimento em infraestrutura de data centers de IA?

A lógica central é a transição de "treinamento dominante" para "explosão de demanda em toda a pilha". As quatro gigantes tecnológicas — Microsoft, Google, Amazon e Meta — têm gastos combinados de capital em infraestrutura de IA de até US$ 725 bilhões em 2026. Esse montante não pode ser suportado por um único elo; toda a cadeia industrial — de chips, memória, rede a operação de data centers — está em um ciclo de benefícios estruturais.

Q4: Como negociar ações relacionadas a data centers de IA na plataforma Gate?

A Gate já listou mais de 12.500 ações e ETFs nos mercados dos EUA, Hong Kong e Coreia do Sul. Os usuários podem depositar ativos digitais como USDT e negociar, em uma conta unificada, ativos-chave de infraestrutura de IA como NVIDIA, Micron e SK Hynix, com suporte para negociação pré-mercado e pós-mercado, modo alavancado e spot, com taxas tão baixas quanto 0,1%.

Q5: Quais são os riscos do investimento em infraestrutura de data centers de IA?

Os principais riscos incluem: primeiro, o descompasso entre oferta e demanda pode levar a excessos periódicos — o BOCOM International aponta a necessidade de observar possíveis desajustes temporários de oferta e demanda e volatilidade de valuation em ciclos mais longos; segundo, a sustentabilidade dos gastos de capital dos provedores de serviços em nuvem de hiperescala — o JPMorgan aponta que a taxa de crescimento dos gastos de capital entre 2025 e 2026 supera em muito a taxa de crescimento real da receita, pressionando o fluxo de caixa; terceiro, as tensões geopolíticas e os controles de exportação que perturbam a cadeia de suprimentos de chips de processo avançado.

BTC-1,00%
ETH0,46%
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado