Bernstein elevou o preço-alvo da Haiguang Information de 280 para 450 RMB ontem, com a lógica central de que a Agentic AI está a revolucionar o padrão "GPU monopoliza o capex de IA" dos últimos quatro anos, fazendo com que o CPU volte a ser protagonista, em vez de coadjuvante. O TAM global de CPUs para servidores expande de 39 mil milhões de dólares em 2025 para 223 mil milhões de dólares em 2030, um aumento de seis vezes. A Haiguang, como o único fornecedor global de CPUs x86 para servidores fora da Intel/AMD, é o beneficiário chinês mais direto desta mudança estrutural.



Primeiro, vejamos porque é que a Agentic AI tem uma procura por CPU completamente diferente da LLM tradicional. Na era das LLM, a carga de trabalho mapeia-se em operações massivas de matrizes paralelas, onde a GPU se encaixa naturalmente, e a relação GPU:CPU nos clusters de treino das CSP passou de 3:1 em 2020 para 8:1 em 2024. Mas a estrutura computacional da Agentic AI é totalmente diferente. Orquestração de agentes, chamadas de ferramentas, gestão de janelas de contexto, coordenação multi-agente, ciclos de interação humano-máquina — tudo isto é processamento sequencial de propósito geral, que exige baixa latência e alta largura de banda de memória, tarefas próprias do CPU. O trabalho da GPU recua para a geração de tokens em si, e tudo o resto regressa ao CPU. Os dados da Bernstein indicam que a relação GPU:CPU se inverterá para 2:1 em 2030, e a quota do CPU no capex de IA para clusters de inferência subirá de 14% para 50%.

A própria AMD deu uma previsão de TAM de CPU de 60 mil milhões de dólares no Dia do Analista em novembro de 2025, e duplicou para 120 mil milhões na conferência de resultados do Q1 de 2026, seis meses depois. A Intel conseguiu vender até chips de inventário que tinham sido anteriormente desvalorizados e abatidos, com os clientes a disputá-los. A tensão entre oferta e procura é evidente.

O TAM de CPUs x86 para servidores na China passa de 7 mil milhões de dólares em 2025 para 27 mil milhões de dólares em 2030, mas o ritmo de crescimento divide-se em duas fases. De 2025 a 2028, o CAGR é de cerca de 31%, abaixo dos 35% globais, devido a uma dupla restrição de oferta. Por um lado, a capacidade de produção da AMD e da Intel é absorvida prioritariamente pelos hiperscalers americanos, com a quota atribuída à China a diminuir. Por outro, a capacidade de produção em nós avançados da SMIC é limitada, o que restringe tanto a expansão das placas de aceleração AI nacionais (a insuficiência de oferta de placas de aceleração AI comprime diretamente a procura associada de CPUs) como a própria alocação de wafers da Haiguang. Após 2028, estas duas restrições aliviam-se simultaneamente. A libertação em escala da capacidade de produção em nós avançados da SMIC e de outras fundições nacionais, o aumento da oferta de chips AI nacionais que acelera a implementação global de servidores, juntamente com o investimento em AIDC liderado pelos governos locais, faz com que o CAGR do mercado de CPUs na China suba para 36%, começando a superar o global.

A evolução geracional tecnológica da Haiguang merece uma análise detalhada. Começou com a licença da AMD Zen1 em 2016, e após ser colocada na lista de entidades em 2019, perdeu o suporte técnico subsequente da AMD, mas a licença IP do Zen1 em si não pode ser revogada retroativamente. Da Gen2 à G4, sob a restrição do nó de 14nm (mais tarde convertido para SMIC N+1/equivalente a 10nm), a Haiguang alcançou melhorias de desempenho de 30-50% por geração através de melhorias autónomas na arquitetura, subsistema de memória e I/O. A G4 já atinge 64 núcleos, DDR5, PCIe5.0, com uma pontuação SPEC2017 int-rate de cerca de 1000, comparável aos Intel Xeon de quarta/quinta geração (produtos de 2022-2023) e AMD Zen3 (produto de 2021), com uma diferença tecnológica estável de 2-3 anos. Uma validação lateral interessante é a vulnerabilidade de hardware StackWarp divulgada este ano, que afetou várias gerações de processadores AMD Zen, mas a Haiguang não foi afetada, porque a sua arquitetura de segurança já foi substituída do AMD SEV-SNP para o CSV3 próprio. Isto mostra que a divergência ao nível da microarquitetura é real, não uma mera renomeação.

A G5 é o ponto fulcral de toda a lógica de crescimento. 128 núcleos, 512 threads (SMT4), 16 canais DDR5, CXL2.0, microarquitetura totalmente própria, fabricada no SMIC N+2 (equivalente a 7nm). A Bernstein estima uma pontuação SPEC2017 int-rate acima de 2000, enquanto o Intel Granite Rapids (128 núcleos P, lançado em setembro de 2024) pontua 2440, e o AMD Zen5 (2024) pontua 2089. Se a G5 sair conforme planeado, a diferença da Haiguang para os produtos mais recentes a nível global reduz-se de "duas gerações de diferença" para "uma geração de diferença".

A viabilidade de 128 núcleos não depende de um avanço no nó, mas sim do encapsulamento chiplet. Em vez de um die monolítico gigante de 128 núcleos (a taxa de rendimento ruiria), vários compute chiplets mais pequenos são empacotados juntos, uma abordagem que a AMD EPYC segue desde o Zen2. Com dies de computação de área mais pequena no nó equivalente a 7nm da SMIC, a taxa de rendimento é controlável, e o número total de núcleos depende de quantos dies são empacotados. O aumento de +17% no IPC vem da experiência acumulada em quatro gerações de design de fluxo completo, da Gen2 à G4, juntamente com a maturidade das ferramentas EDA nacionais na síntese lógica digital em 7nm. Os 16 canais DDR5 dependem da expansão da capacidade de produção de DDR5 da CXMT (ChangXin Memory Technologies) e do IP do controlador CXL da Montage Technology. Dos três requisitos, a alocação de capacidade de produção em 7nm da SMIC é o gargalo mais duro.

O verdadeiro fator diferenciador da Haiguang G5 é o SMT4. 512 threads por socket, o nível mais alto entre todos os CPUs para servidores atuais. Os produtos mainstream da AMD e Intel usam SMT2. Em que cenários o SMT4 é vantajoso? Serviços de inferência multi-inquilino (densidade de CPUs lógicos duplicada, custo por pedido de inferência reduzido), camada de orquestração da Agentic AI (muitos threads leves limitados por I/O e memória), e inferência LLM com restrição de memória (quando os threads esperam por dados de KV-cache, outros threads podem utilizar as unidades de execução). Isto é precisamente o maior cenário de crescimento futuro no mercado chinês. A China tem vantagens estruturais no lado da inferência: baixo custo de eletricidade, juntamente com as capacidades de otimização de inferência LLM demonstradas por empresas como a DeepSeek, o que significa maior produção de tokens com a mesma capacidade de computação. Se a proporção CPU:GPU nos centros de dados chineses for, por isso, superior à dos EUA, o potencial de subida na procura de CPU será ainda maior do que o caso base da Bernstein.

A previsão de quota de mercado da Bernstein para a Haiguang é de 19% em valor em 2025 para 36% em 2030, e perto de 50% em volume de envios (devido ao ASP inferior ao da Intel/AMD). A lógica divide-se em duas fases. A primeira é a absorção contínua da procura reprimida do mercado de confiança nacional (Xinchuang), uma base impulsionada por políticas que não depende do valor absoluto do desempenho. A segunda é o início das compras comerciais pelas CSP a partir de 2027, que constitui a maior parte do crescimento. O segmento de clientes CSP representará cerca de 75% das implementações de servidores x86 na China até 2030. A Haiguang, neste mercado, precisa de passar da atual penetração de dígito único médio para 20%, o que requer que o desempenho da G5 seja suficiente e que a oferta da AMD/Intel continue apertada. A Haiguang tem ainda uma alavanca única: o empacotamento total (stack) CPU+DCU (placa de aceleração AI). Durante o período de escassez de oferta de chips AI nacionais, a Haiguang pode trocar direitos de alocação de DCU por volume de compras de CPU, e vice-versa. Nenhuma outra empresa, exceto a Huawei, consegue fazer isto.

A validade de toda esta lógica depende, do lado da oferta, da capacidade de a SMIC aumentar a produção nos nós avançados para sustentar o volume contínuo da G5, e, do lado da procura, da aceitação e validação pelos clientes CSP. A G5 já foi confirmada em produção e envio em junho, com servidores complementares que vão desde arrefecimento a ar de via dupla até arrefecimento líquido por imersão (grupos individuais com mais de 80.000 núcleos), mas atualmente não existem dados públicos independentes de benchmarks SPEC. A pontuação de 2000 é uma estimativa da Bernstein, não uma medição real. As compras em grande escala pelas CSP exigem um ciclo de validação POC, que normalmente leva dois a três trimestres desde a amostragem até à certificação de qualificação e colocação em massa. Vejamos se haverá encomendas centralizadas de CSP de topo no segundo semestre do ano.
Ver original
post-image
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado