Nos últimos três anos, a narrativa central da corrida por capacidade computacional de IA foi altamente uniforme: os hiperescaladores expandiram centros de dados e adquiriram GPUs a um custo quase ilimitado, levando as despesas de capital a máximos históricos. Em 2026, prevê-se que as despesas de capital combinadas dos quatro gigantes da cloud — Amazon, Microsoft, Google (Alphabet) e Meta — atinjam 725 mil milhões de dólares, um aumento de 77% face aos 410 mil milhões de 2025. Se incluirmos a NVIDIA, Apple, Tesla, etc., no âmbito das “Magnificent Seven”, este número aproxima-se dos 754,2 mil milhões de dólares. A Gartner prevê que a despesa global total em IA em 2026 atinja os 2,59 biliões de dólares, um aumento de 47% face ao ano anterior.

No entanto, a escala está a perder o seu estatuto de foco único. Uma mudança mais profunda está a ocorrer: as despesas de capital em IA estão a passar de uma concentração elevada para uma distribuição. A DIGITIMES define a palavra-chave tecnológica para 2026 como “dispersão”, simbolizando a dupla transformação de “descentralização” no mercado de IA e nas cadeias de abastecimento. Isto não é apenas uma dispersão geográfica, mas uma reestruturação abrangente dos sujeitos de investimento, da arquitetura técnica e da estrutura industrial.

O fim da concentração: A “fatura” de 725 mil milhões de dólares e a ansiedade pelo retorno

Para compreender o ponto de partida da distribuição, é necessário primeiro observar o pico da concentração.

Em 2026, espera-se que as despesas de capital totais dos quatro maiores hiperescaladores estejam entre 650 e 700 mil milhões de dólares, representando cerca de 40% do total de despesas de capital do índice Russell 1000, o dobro do nível de 2024. Os números específicos de cada um são os seguintes: Amazon fixa cerca de 200 mil milhões, a Microsoft mantém a expectativa de 190 mil milhões, a Alphabet aumenta para 175-185 mil milhões, e a Meta fica entre 125 e 145 mil milhões.

A velocidade deste ajuste numérico é, por si só, um sinal importante. Apenas nos últimos seis meses, as expectativas do mercado para as despesas de capital dos fornecedores de cloud em 2026 aumentaram quase 80%. O Barclays prevê que as despesas de capital dos principais fornecedores de cloud atinjam 919 mil milhões de dólares em 2027 e cerca de 1,16 biliões em 2028. A CreditSights estima que, em 2026, cerca de 75% das despesas de capital totais dos hiperescaladores serão destinadas a infraestruturas relacionadas com IA, ou seja, cerca de 450 mil milhões de dólares em despesas específicas de IA.

Mas a expansão da escala concentrada está a enfrentar questionamentos sobre o retorno. Em junho de 2026 (hora de Pequim), as ações da Microsoft caíram quase 20% num mês, e o seu valor de mercado evaporou cerca de 1,3 biliões de dólares nos últimos 8 meses. O foco do escrutínio dos investidores são precisamente as despesas de capital de cerca de 190 mil milhões de dólares da Microsoft em 2026 — das quais cerca de dois terços são aplicados em ativos de curto ciclo, como GPUs e CPUs, que depreciam mais rapidamente e estão diretamente ligados a receitas de curto prazo. A margem bruta do Microsoft Cloud foi orientada para 64%, uma queda de 4 pontos percentuais face ao ano anterior. Num relatório de junho, a Goldman Sachs apontou que o investimento tecnológico dos EUA como percentagem do PIB subiu para cerca de 4,9%, ultrapassando o pico do período da bolha da internet por volta de 2000.

O retorno marginal do investimento concentrado está a diminuir, o que fornece a força motriz mais direta para a distribuição.

Ponto de inflexão da inferência: Porque é que a capacidade computacional tem de se tornar distribuída

A lógica subjacente à distribuição das despesas de capital em IA é, em primeiro lugar, a própria mudança na estrutura da procura por capacidade computacional.

O CEO da NVIDIA, Jensen Huang, afirmou claramente na GTC 2026 que a carga de trabalho de inferência de IA atingirá mil milhões de vezes a do treino, e que a era da inferência chegou totalmente. A IDC prevê que, até 2027, as tarefas de inferência representarão mais de 70% da procura total de capacidade computacional inteligente. Os dados da TrendForce são mais específicos: em 2026, a taxa de crescimento anual da capacidade computacional de inferência de IA é de 122%, superando largamente os 56% de crescimento da capacidade computacional de treino de IA.

Os requisitos de infraestrutura para treino e inferência são completamente diferentes. O treino é uma tarefa computacional centralizada, de alta densidade e longa duração, naturalmente adequada para ser implantada em centros de dados de hiperescala. A inferência é uma tarefa de resposta em tempo real distribuída, de baixa latência e alta concorrência — quando um agente de IA precisa de completar uma inferência e devolver o resultado em dezenas de milissegundos, a latência física dos dados viajando do edge para o centro de dados centralizado e de volta torna-se um gargalo intransponível.

Os arquitetos da Akamai apontam que os cenários de jogos exigem um controlo da latência do primeiro token abaixo de 15 milissegundos, as recomendações de e-commerce cerca de 20 milissegundos, enquanto a latência de rede de dezenas de milissegundos entre os centros de dados centralizados tradicionais e os utilizadores finais se tornou um gargalo intransponível para cenários de interação em tempo real. Numa implantação centralizada, 1 GW de capacidade computacional requer 75 Tbit/s de largura de banda de saída (Blackwell); a próxima geração, Vera Rubin, exigirá 135 Tbit/s. Distribuindo por 20 nós, cada ponto precisa apenas de 3,75 Tbit/s. Isto é um problema aritmético decidido pelas leis da física, não uma escolha de estratégia comercial.

Entretanto, a interação multimodal gera enormes volumes de tráfego de saída, e os custos de largura de banda, persistentemente elevados na cloud pública, estão a tornar-se um “assassino invisível” da rentabilidade dos negócios de IA. Somando-se a isto o endurecimento das regulamentações de localização de dados na UE (GDPR), Sudeste Asiático, Médio Oriente e outras regiões, a implantação centralizada está a cair numa situação difícil de conciliar experiência, custo e conformidade. A capacidade computacional de IA já não se concentra apenas na cloud central, mas começa a evoluir para uma arquitetura distribuída de três níveis: “core — regional — edge”.

Dos quatro gigantes a toda a cadeia industrial: A expansão dos participantes nas despesas de capital

A segunda dimensão da distribuição é a proliferação dos sujeitos de investimento.

Nos últimos três anos, o investimento em infraestrutura de IA foi quase dominado pelos quatro grandes fornecedores de cloud e pela NVIDIA. Mas em 2026, este cenário está a mudar. Os cálculos da Zhongtai Securities mostram que, em 2026, as despesas de capital totais em IA das MAG7 são de cerca de 754,2 mil milhões de dólares, enquanto as despesas de capital em IA da China continental totalizam cerca de 805,8 mil milhões de RMB (cerca de 110 mil milhões de dólares). Somando as duas vias, a contribuição das despesas de capital em IA dos EUA e da China para o PIB chinês em 2026 é de cerca de 1.007,6 mil milhões de RMB, representando 0,68% do PIB, com uma contribuição marginal para o crescimento do PIB de cerca de 0,33 pontos percentuais. A montante e a jusante da IA já ultrapassaram a cadeia de investimento em infraestruturas locais, tornando-se o incremento marginal do crescimento do PIB.

A participação das empresas está a acelerar. A mais recente pesquisa do RBC mostra que as empresas estão a acelerar a adoção de IA, com a maioria a passar de testes para produção oficial. Um inquérito japonês sobre a utilização de IA nas empresas revela que 47,8% das empresas atingiram o nível de “operação real” (本番稼働), com uma taxa de operação real de 62,7% nas grandes empresas. Embora a taxa de adoção nas PME ainda seja limitada (cerca de 12% no Japão), os 64,7% nas grandes empresas indicam que a implementação empresarial de IA já passou da prova de conceito para a fase de escala.

A participação dos Estados-nação é igualmente inegável. Jensen Huang revelou na assembleia geral de acionistas de junho de 2026 (hora de Pequim) que cerca de 40 países e regiões, representando um total de 50 biliões de dólares em PIB, estão a construir fábricas de IA impulsionadas por infraestruturas da NVIDIA. O investimento em infraestrutura de IA está a evoluir de um “assunto interno das empresas tecnológicas” para uma “competição estratégica a nível nacional”.

A distribuição das despesas de capital reflete-se também na estrutura de financiamento. A Zhongtai Securities salienta que as despesas de capital dos gigantes tecnológicos americanos entraram na fase impulsionada pelo financiamento por dívida. As despesas de capital dos hiperescaladores já não dependem inteiramente do fluxo de caixa livre, mas sim da alavancagem através do financiamento por dívida. Esta mudança no modelo de financiamento significa que a sustentabilidade das despesas de capital já não depende apenas do fluxo de caixa de uma única empresa, mas está ligada a um ambiente de mercado de crédito mais amplo.

Edge como linha da frente: A implementação de infraestrutura de IA distribuída

A manifestação mais concreta da tendência de distribuição está na computação de edge.

Em 2026, a IA de edge está a passar do conceito para a implementação em grande escala. A “AI Mesh” criada em conjunto pela Akamai e pela NVIDIA já foi implementada, transformando a sua rede global de mais de 4.400 nós de edge numa plataforma de inferência de IA distribuída. A Akamai está a transformar-se de um fornecedor líder global de distribuição cloud na maior plataforma global de inferência de IA distribuída, tendo já implementado GPUs NVIDIA Blackwell RTX 6000 PRO em grande escala a nível mundial.

Esta transformação não é um caso isolado. Em junho de 2026 (hora de Pequim), a empresa de computação inteligente de edge, Skylandt, concluiu uma ronda de financiamento Série E de mais de 1 milhão de RMB, liderada pelo Fundo de Investimento em Internet da China. A empresa anunciou simultaneamente uma atualização abrangente de “fornecedor de serviços de computação inteligente de edge” para um “tecido de computação inteligente em tempo real” orientado para a era AGI. A Antimatter obteve 300 milhões de euros para implementar os primeiros 100 centros de dados miniaturizados distribuídos Policloud em 2026. A NXP reforçou o seu portfólio de produtos de IA de edge através da aquisição da Kinara, adicionando NPUs independentes.

A IDC prevê que, até 2027, mais de 80% das empresas implementarão infraestruturas de edge distribuídas. A taxa de crescimento da construção de infraestruturas de edge ultrapassará a dos centros de dados centrais. Isto significa que o edge já não é um complemento da cloud, mas está a tornar-se um componente central da infraestrutura de IA.

A lógica comercial da IA de edge é clara: as tarefas de inferência são muito mais sensíveis à latência do que as tarefas de treino, e os nós de edge estão naturalmente próximos das fontes de dados e dos utilizadores. Para as empresas, a implementação de edge também resolve múltiplos problemas, como conformidade de dados (os dados não saem do país), custos de largura de banda (redução da transmissão para a cloud) e fiabilidade (recuperação local de desastres). Estes problemas são difíceis de resolver simultaneamente numa arquitetura centralizada, mas encontram soluções viáveis numa arquitetura distribuída.

Era da infraestrutura multicamada: A mudança estrutural na lógica de investimento

A infraestrutura de IA está a evoluir de “única e centralizada” para “multicamada e distribuída”. O impacto desta mudança na lógica de investimento é profundo.

Em primeiro lugar, a estrutura da procura de chips está a mudar. Do lado do treino, a NVIDIA continua a dominar com as suas GPUs — no ano fiscal de 2026, a receita do segmento de data center da NVIDIA atingiu 193,7 mil milhões de dólares, um aumento de 68%. No entanto, a procura diversificada do lado da inferência está a criar um mercado incremental para ASICs e chips de edge. As instituições preveem que, em 2026, as remessas de chips ASIC atinjam cerca de 7,7 milhões de unidades, com uma quota de 45%, e que ultrapassem a quota das GPUs em 2027, atingindo 58%. A Broadcom deverá ocupar cerca de 60% do mercado de ASIC de capacidade computacional para servidores de IA até 2027.

Em segundo lugar, a distribuição geográfica do investimento em infraestrutura está a mudar. Os centros de dados de hiperescala continuam a expandir-se — prevê-se que o investimento acumulado global em centros de dados atinja 1,6 biliões de dólares até 2030 — mas a construção de nós de edge está a crescer a um ritmo ainda mais rápido. A capacidade computacional de IA já não se concentra apenas na cloud central, mas está a dispersar-se para uma arquitetura de três níveis: “core — regional — edge”.

Em terceiro lugar, o período de avaliação do retorno do investimento está a mudar. O período de retorno do investimento em centros de dados centralizados é longo, com elevada intensidade de capital, exigindo vários anos para recuperar os custos. Já as implementações de IA de edge são normalmente de menor escala, ciclo mais curto e mais próximas de cenários de negócio específicos, permitindo uma granularidade mais fina na avaliação do retorno. Esta diferença está a alterar a lógica de avaliação dos mercados de capitais para o investimento em IA — passando de “quem gasta mais dinheiro” para “quem gasta dinheiro de forma mais eficiente”.

De acordo com a Research and Markets, o tamanho do mercado global de infraestrutura de inteligência artificial crescerá de 71,88 mil milhões de dólares em 2025 para 90,91 mil milhões de dólares em 2026. No entanto, este número abrange apenas o mercado de hardware de infraestrutura no sentido restrito. Se incluirmos a implementação empresarial de IA, a computação de edge, as soluções setoriais, etc., a escala distribuída das despesas de capital em IA ultrapassa largamente este valor.

Riscos e restrições: A distribuição não é um caminho fácil

A tendência de distribuição das despesas de capital em IA é clara, mas não está isenta de restrições.

Os gargalos do lado da oferta continuam proeminentes. A oferta dos produtos da série Blackwell da NVIDIA está tensa, com a procura a exceder a oferta durante vários trimestres. A capacidade de produção de componentes-chave como o HBM já foi pré-reservada por grandes clientes até 2026 ou mesmo 2027. A Bernstein Research aponta que só o aumento do preço do HBM pode aumentar as despesas de capital em IA dos hiperescaladores em cerca de 30% no total.

A infraestrutura elétrica é outra restrição. A procura de eletricidade dos centros de dados de IA está a aproximar-se do limite de capacidade das redes elétricas existentes. A ligação elétrica de um cluster de capacidade computacional centralizado de 1 GW é, por si só, um projeto que leva vários anos. Embora a arquitetura distribuída reduza a procura elétrica em cada ponto, coloca novas exigências à capacidade de conexão distribuída da rede elétrica.

Os riscos geopolíticos também são inegáveis. As restrições à exportação de chips avançados de IA pelos EUA continuam a afetar as cadeias de abastecimento globais. A NVIDIA excluiu claramente o impacto da receita do seu segmento de data center na China no relatório de resultados do primeiro trimestre do ano fiscal de 2027. Embora o mapeamento mútuo das despesas de capital em IA entre a China e os EUA seja estreito, a incerteza política está a aumentar os custos de fricção na cadeia de abastecimento.

Finalmente, a paciência dos mercados de capitais quanto ao retorno do investimento em IA está a diminuir. A Goldman Sachs salienta claramente que a contradição central no mercado de IA está a intensificar-se — os fundamentos continuam fortes, mas o mercado já incorporou demasiados ganhos futuros. Desde novembro de 2022, o valor de mercado das empresas relacionadas com IA disparou 27 biliões de dólares, ultrapassando largamente os 9 biliões de dólares estimados pelos referenciais macroeconómicos. Se o investimento distribuído não se traduzir mais rapidamente em receitas e lucros, a atitude do mercado de capitais pode passar de “questionar a escala” para “questionar a lógica”.

Conclusão

A distribuição das despesas de capital em IA não é uma negação da concentração, mas sim um complemento e uma extensão da mesma.

O treino continuará a exigir centros de dados de hiperescala; a inferência está a caminhar para o edge. Os gigantes continuam a aumentar o investimento; as empresas e os estados-nação estão a entrar no jogo. As GPUs continuam a ser a força principal no treino; os ASICs e os chips de edge estão a abrir novos campos de batalha. Esta é uma era de infraestrutura multicamada — diferentes níveis assumem diferentes funções, e diferentes participantes ocupam diferentes nichos ecológicos.

2026 é o ponto nodal crítico desta mudança estrutural. A DIGITIMES prevê que o crescimento das despesas de capital no mercado global de IA desacelere de 66% em 2025 para 31% em 2026, mas a desaceleração não significa estagnação. Pelo contrário, a desaceleração da taxa de crescimento geralmente indica que a indústria está a passar de uma “expansão extensiva” para uma “construção refinada”. A infraestrutura de IA está a evoluir de um mercado concentrado “o vencedor leva tudo” para um ecossistema de “colaboração em camadas”.

Para os investidores, compreender o significado desta mudança estrutural pode ser mais importante do que acompanhar os números das despesas de capital do próximo trimestre. A distribuição das despesas de capital em IA está a remodelar a lógica de investimento de longo prazo na cloud computing, design de chips, arquitetura de TI empresarial e até políticas industriais nacionais. O destino final desta mudança ainda é desconhecido, mas a sua direção já é suficientemente clara.

FAQ

P1: Qual é a força motriz central da distribuição das despesas de capital em IA?

O crescimento explosivo da procura de inferência é a força motriz central. Em 2026, a taxa de crescimento anual da capacidade computacional de inferência de IA é de 122%, superando largamente os 56% do treino. A necessidade de baixa latência e alta concorrência nas tarefas de inferência cria um gargalo físico para os centros de dados centralizados, tornando os nós de edge distribuídos uma escolha inevitável. Simultaneamente, fatores como a conformidade de dados e os custos de largura de banda também impulsionam a descida da capacidade computacional.

P2: Quais são as despesas de capital específicas dos quatro grandes fornecedores de cloud em 2026?

Amazon: cerca de 200 mil milhões de dólares; Microsoft: cerca de 190 mil milhões; Alphabet: cerca de 175-185 mil milhões; Meta: cerca de 125-145 mil milhões. Total combinado de cerca de 725 mil milhões de dólares, um aumento de 77% face a 2025. Cerca de 75% deste total é destinado a infraestruturas relacionadas com IA.

P3: Qual é a relação entre a IA de edge e a cloud computing?

Ambas são complementares, não substitutas. A cloud central é responsável pelo treino de modelos grandes e inferência complexa; os nós de edge são responsáveis pela resposta em tempo real de baixa latência, pré-processamento de dados e tratamento localizado para conformidade. A capacidade computacional de IA está a evoluir para uma arquitetura distribuída de três níveis — “core — regional — edge” — formando um ecossistema de colaboração em camadas.

P4: Qual é o impacto da distribuição das despesas de capital em IA na indústria de chips?

Do lado do treino, a NVIDIA continua a dominar com as suas GPUs — no ano fiscal de 2026, a receita do segmento de data center atingiu 193,7 mil milhões de dólares. No entanto, a procura do lado da inferência está a criar um mercado incremental para ASICs e chips de edge. As previsões indicam que as remessas de ASICs em 2026 atinjam cerca de 7,7 milhões de unidades, e que a sua quota de mercado ultrapasse a das GPUs em 2027. A procura de chips está a evoluir de “um único líder” para “múltiplos líderes em coexistência”.

P5: Até quando pode durar o elevado crescimento do investimento em infraestrutura de IA?

O Barclays prevê que as despesas de capital dos principais fornecedores de cloud atinjam 919 mil milhões de dólares em 2027 e cerca de 1,16 biliões em 2028. A administração da NVIDIA aumentou o limite máximo das despesas anuais da indústria de IA para 4 biliões de dólares até 2030. No entanto, a taxa de crescimento está a abrandar — de 66% em 2025 para 31% em 2026 — indicando que a indústria está a passar de uma “expansão extensiva” para uma “construção refinada”.

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.

Recompensa
gostar
Comentar
Republicar
Partilhar

Comentar

Adicionar um comentário

Nenhum comentário

Tópicos em destaque
Ver mais
#
GateCompletesDividendDistribution
135,19K Popularidade
#
StrategyBuybackSurges12%
1,11M Popularidade
#
IsraelStrikesIranBTCPlunges
67,28K Popularidade
#
PredictWorldCupShare20000U
564,65K Popularidade
#
TrumpDisclosesOver100MBTCETH
3,83M Popularidade

Fixado

As despesas de capital de AI estão a ser distribuídas: a segunda reestruturação da infraestrutura tecnológica está a acontecer.

O fim da concentração: A “fatura” de 725 mil milhões de dólares e a ansiedade pelo retorno

Ponto de inflexão da inferência: Porque é que a capacidade computacional tem de se tornar distribuída

Dos quatro gigantes a toda a cadeia industrial: A expansão dos participantes nas despesas de capital

Edge como linha da frente: A implementação de infraestrutura de IA distribuída

Era da infraestrutura multicamada: A mudança estrutural na lógica de investimento

Riscos e restrições: A distribuição não é um caminho fácil

Conclusão

FAQ

Tópicos em destaque

GateCompletesDividendDistribution

StrategyBuybackSurges12%

IsraelStrikesIranBTCPlunges

PredictWorldCupShare20000U

TrumpDisclosesOver100MBTCETH

Fixado