中信建投:Capacidade de IA e exploração comercial espacial entram em fase de aceleração industrial

A pesquisa da CITIC Securities aponta que a capacidade de cálculo de IA e o setor de exploração espacial comercial estão entrando numa fase de aceleração industrial. No lado da capacidade de cálculo, a evolução das aplicações está reestruturando profundamente a infraestrutura: o agente impulsiona a transferência da carga de trabalho de GPUs para CPUs, aumentando significativamente a proporção de CPUs em centros de dados; a explosão na demanda por capacidade de IA, combinada com o aumento dos preços da memória e a escassez de capacidade, tem impulsionado a escassez e o aumento de preços de CPUs de servidores desde este ano; a busca por redução de custos na inferência de grandes modelos está acelerando a implementação de ASICs por gigantes do setor, levando a uma direção de colaboração heterogênea entre GPUs e ASICs. No setor espacial, aproveitando o Dia do Espaço de 2026 como oportunidade, com o amadurecimento de foguetes reutilizáveis de múltiplos tipos, a ampliação da capacidade de transporte acelerará a implementação de redes de internet via satélite, impulsionando o setor de exploração espacial comercial a um estágio de desenvolvimento de alta qualidade.

O texto completo segue abaixo

Foco nas oportunidades de desenvolvimento da capacidade de inferência e do setor de exploração espacial comercial

A capacidade de cálculo de IA e o setor de exploração espacial comercial estão entrando numa fase de aceleração industrial. No lado da capacidade de cálculo, a evolução das aplicações está reestruturando profundamente a infraestrutura: o agente impulsiona a transferência da carga de trabalho de GPUs para CPUs, aumentando significativamente a proporção de CPUs em centros de dados; a explosão na demanda por capacidade de IA, combinada com o aumento dos preços da memória e a escassez de capacidade, tem impulsionado a escassez e o aumento de preços de CPUs de servidores desde este ano; a busca por redução de custos na inferência de grandes modelos está acelerando a implementação de ASICs por gigantes do setor, levando a uma direção de colaboração heterogênea entre GPUs e ASICs. No setor espacial, aproveitando o Dia do Espaço de 2026 como oportunidade, com o amadurecimento de foguetes reutilizáveis de múltiplos tipos, a ampliação da capacidade de transporte acelerará a implementação de redes de internet via satélite, impulsionando o setor de exploração espacial comercial a um estágio de desenvolvimento de alta qualidade.

O agente impulsiona a transferência da carga de trabalho de GPUs para CPUs, e a proporção de CPUs em centros de dados tem potencial para aumentar significativamente. A inferência de grandes modelos tradicionais usa um modo de solicitação-resposta única, enquanto os agentes envolvem ciclos complexos de inferência de múltiplas etapas, incluindo observação do ambiente, execução de inferência, tomada de decisão, execução de ações e recepção de feedback, entre outros, e uma única tarefa de agente pode envolver dezenas ou até centenas de chamadas a LLMs. À medida que o número e a complexidade dos agentes aumentam, a carga nos módulos de CPU também cresce. A IA agêntica de médio a longo prazo trará uma demanda enorme por computação geral; com o aumento da proporção de tarefas de agentes de alta complexidade, a proporção de CPUs para GPUs em centros de dados de IA passará de 1:8 para 1:4, e no futuro para 1:2 a 1:1, o que aumentará significativamente a demanda de mercado por CPUs.

A explosão na demanda por capacidade de IA, combinada com o aumento dos preços da memória e a escassez de capacidade, tem impulsionado a escassez e o aumento de preços de CPUs de servidores desde este ano. De final de 2025 até o início de 2026, o aumento de preços de CPUs mostra uma característica progressiva clara, propagando-se do mercado de consumo para o empresarial, semelhante à lógica da memória. O crescimento na demanda por capacidade de IA tem causado escassez contínua de CPUs por dois motivos: primeiro, o aumento da demanda por CPUs em si; segundo, os materiais-prima e a capacidade de produção de CPUs estão sendo amplamente utilizados por fabricantes de GPUs. Atualmente, a demanda geral por CPUs é forte, mas há escassez de componentes, e a velocidade de entrega de servidores completos permanece relativamente lenta, levando a um acúmulo de pedidos não entregues por parte dos fabricantes. Com o rápido aumento na demanda por agentes, a escassez de CPUs no curto prazo deve persistir, e os preços continuarão a subir.

Gigantes globais de tecnologia estão acelerando seus investimentos em CPUs, confirmando a importância crescente da CPU na infraestrutura de capacidade de cálculo de IA. Em março deste ano, a Nvidia começou a vender sua CPU Vera como produto independente, direcionada a agentes de IA e aprendizagem reforçada. A Arm também lançou em março sua primeira CPU de desenvolvimento próprio — a Arm AGI CPU, marcando uma reestruturação histórica do modelo de negócios da Arm, que passou de licenciamento de conjuntos de instruções ou núcleos padrão para fornecimento direto de chips a provedores de nuvem e servidores. Em resposta às mudanças no ecossistema da Arm, os gigantes de CPUs, Intel e AMD, estão aproveitando sua experiência em ecossistemas de conjuntos de instruções complexos e embalagens avançadas para construir barreiras de defesa por meio de computação heterogênea e ecossistemas abertos. Além disso, principais provedores de nuvem como AWS, Google e Microsoft estão acelerando seus esforços de desenvolvimento interno, entrando rapidamente no mercado de CPUs para servidores.

Grandes modelos de IA estão migrando do treinamento para a inferência, e o custo por token tornou-se um gargalo central para a expansão dos negócios de empresas de IA. Embora GPUs genéricas tradicionais (como Nvidia) tenham vantagem absoluta no ecossistema, a crescente lacuna de desempenho-custo na inferência de IA está dificultando os provedores de serviços de grandes modelos. Os chips ASIC, com melhor relação de consumo de energia sob cargas específicas, capacidade de customização altamente direcionada e eliminação de cálculos redundantes, estão se tornando a solução ideal para reduzir significativamente o custo de inferência por token. Segundo previsão da Marvell, o mercado global de ASICs de IA deve passar de 6,6 bilhões de dólares em 2023 para 55,4 bilhões até 2028, com uma taxa de crescimento anual composta de 53%. A médio e longo prazo, à medida que a escala de aplicações de IA se concretiza, a lógica de construção de infraestrutura de capacidade de cálculo mudará do treinamento para a eficiência de inferência, impulsionando a demanda por chips ASIC.

A redução de custos e aumento de eficiência, aliada à necessidade de evitar riscos na cadeia de suprimentos, está levando os principais fabricantes globais de IA a acelerar a diversificação de fontes de chips de IA. Diante do fortalecimento do ecossistema de GPUs genéricas, cada vez mais grandes clientes preferem soluções desacopladas de hardware e software para reduzir riscos de aquisição. Em 14 de abril, Meta e Broadcom estenderam sua parceria para chips de IA personalizados (MTIA) até 2029, planejando usar processos avançados de 2nm para implantar vários gigawatts de capacidade de cálculo; ao mesmo tempo, OpenAI, Google, AWS e outros estão aumentando seus esforços de desenvolvimento conjunto com fabricantes externos de ASICs como Broadcom e Marvell. Isso demonstra que as grandes empresas de tecnologia estão se afastando da dependência exclusiva de GPUs genéricas, e o modo de implantação de capacidade de cálculo está evoluindo de monopólio de fornecedores únicos para uma colaboração heterogênea com GPUs principais e ASICs personalizados/desenvolvidos internamente.

Startups de chips de IA estão optando cada vez mais por ASICs. Entre as startups atuais de chips de IA, mais de 60% escolheram a rota de ASIC, com três principais estratégias de diferenciação: primeiro, focar em cenários extremos, como Cerebras, que abandonam a rota de chips genéricos e desenvolvem ASICs para treinamento de escala ultra grande ou inferência de baixa latência, preenchendo lacunas de cobertura de chips genéricos; segundo, focar em aprofundamento de cenários e otimizações técnicas, sem buscar desempenho extremo, atendendo às necessidades específicas de setores verticais (como resolver gargalos de armazenamento), com custos de construção de ecossistema e migração de clientes relativamente baixos, para alcançar lucratividade em escala; terceiro, adotar estratégias de ecossistema integrado, usando recursos de grandes fabricantes tradicionais de x86 ou outros gigantes para desenvolver soluções personalizadas, complementando ecossistemas de grandes empresas. Espera-se que, no futuro, com o aprofundamento da colaboração heterogênea, a importância e a participação de mercado dos ASICs na infraestrutura de capacidade de cálculo de IA continuem a crescer.

O Dia do Espaço na China de 2026 está se aproximando, com foco no desenvolvimento de alta qualidade do setor de exploração espacial comercial. Em 17 de abril, a Administração Espacial Nacional realizou uma coletiva de imprensa sobre o Dia do Espaço na China de 2026, que está previsto para acontecer em Chengdu, Sichuan, em 24 de abril. Em 2025, a China realizou 92 lançamentos espaciais, um aumento de 35% em relação ao ano anterior; no setor de exploração espacial comercial, o sistema de internet via satélite da China está acelerando a construção de constelações em grande escala, com linhas de produção de satélites em rápida expansão, incluindo os foguetes reutilizáveis Zhuque-3 e Longa Marcha-12, que realizaram testes de voo iniciais. Para 2026, espera-se que as missões espaciais continuem intensas, com vários foguetes reutilizáveis de múltiplos tipos passando por validações de voo, incluindo os próximos testes do Longa Marcha-10B e Zhuque-3. A maior disponibilidade de foguetes deve acelerar ainda mais a construção de sistemas de internet via satélite, levando o setor de exploração espacial comercial a um estágio de desenvolvimento de alta qualidade com altos padrões de segurança.

Resumo: A capacidade de cálculo de IA e o setor de exploração espacial comercial estão entrando numa fase de aceleração industrial. No lado da capacidade de cálculo, a evolução das aplicações está reestruturando profundamente a infraestrutura: o agente impulsiona a transferência da carga de trabalho de GPUs para CPUs, aumentando significativamente a proporção de CPUs em centros de dados; a explosão na demanda por capacidade de IA, combinada com o aumento dos preços da memória e a escassez de capacidade, tem impulsionado a escassez e o aumento de preços de CPUs de servidores desde este ano; a busca por redução de custos na inferência de grandes modelos está acelerando a implementação de ASICs por gigantes do setor, levando a uma direção de colaboração heterogênea entre GPUs e ASICs. No setor espacial, aproveitando o Dia do Espaço de 2026 como oportunidade, com o amadurecimento de foguetes reutilizáveis de múltiplos tipos, a ampliação da capacidade de transporte acelerará a implementação de redes de internet via satélite, impulsionando o setor de exploração espacial comercial a um estágio de desenvolvimento de alta qualidade.

Aviso de riscos: (1) Risco de desaceleração macroeconómica: o setor de informática envolve diversos setores, e sob pressão de desaceleração macroeconómica, os gastos de TI do setor podem ficar abaixo do esperado, afetando a demanda; (2) Risco de inadimplência de contas a receber: muitas empresas de informática operam com contratos de projeto, dependendo da aceitação para receber pagamentos, e o alongamento do ciclo de pagamento dos clientes pode aumentar as inadimplências e levar a perdas por impairment; (3) Intensificação da concorrência no setor: embora a demanda seja relativamente estável, a competição na oferta pode alterar o cenário de mercado; (4) Impacto de mudanças no ambiente internacional: o aumento das tensões comerciais com os EUA e pressões sobre a tecnologia chinesa podem afetar empresas com alta receita no exterior.

(Origem: Caixin)

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar