CITIC Securities: Continuação da perspetiva otimista sobre a tendência de crescimento da inovação em armazenamento

O relatório de pesquisa da CITIC Securities afirma que na era do Agent AI a capacidade de armazenamento é o núcleo, impulsionando a indústria de armazenamento a atravessar uma mudança de paradigma de longo ciclo. Em termos de oferta e procura, a inferência de IA faz disparar drasticamente o consumo de tokens; a KV Cache aumenta de forma linear; a explosão da procura e a descoordenação face ao aumento de capacidade dos fabricantes originais levam à normalização de rupturas de stock. Prevê-se que a situação de excesso de procura relativamente à oferta continue até 2027, e que a subida de preços se mantenha ao longo de 2026. Do ponto de vista técnico, em contexto de escassez extrema e custos elevados de HBM e DRAM, os fornecedores partilham soluções de inovação com NAND, para aliviar a pressão da procura de capacidade de memória. A CITIC Securities continua a mostrar forte confiança na tendência de crescimento da inovação em armazenamento.

O texto integral é o seguinte

Armazenamento | Perspectiva das tendências de desenvolvimento do armazenamento a partir do Flash Memory Summit

Na era do Agent AI, a capacidade de armazenamento é o núcleo, impulsionando a indústria de armazenamento a atravessar uma mudança de paradigma de longo ciclo. Em termos de oferta e procura, a inferência de IA faz disparar drasticamente o consumo de tokens; a KV Cache aumenta de forma linear; a explosão da procura e a descoordenação face ao aumento de capacidade dos fabricantes originais levam à normalização de rupturas de stock. Prevê-se que a situação de excesso de procura relativamente à oferta continue até 2027, e que a subida de preços se mantenha ao longo de 2026. Do ponto de vista técnico, em contexto de escassez extrema e custos elevados de HBM e DRAM, os fornecedores partilham soluções de inovação com NAND, para aliviar a pressão da procura de capacidade de memória. Continuamos a mostrar confiança na tendência de crescimento da inovação em armazenamento.

O Flash Memory Summit da China de 2026 é realizado, com foco em oportunidades de inovação no armazenamento da era de IA e na atualização da cadeia industrial.

A 27 de março de 2026, o CFMS MemoryS 2026, o principal evento anual da indústria global de armazenamento, realiza-se em Shenzhen. Como um summit de referência para a indústria, esta edição tem como tema central “Atravessar o ciclo, libertar valor”, concentrando-se em profundidade nas inovações tecnológicas e na colaboração e atualização da cadeia industrial, atraindo dezenas de empresas globais de topo como a Samsung Electronics, a Himax Technologies, a Kioxia, a Solidigm, a Intel, a Tencent Cloud, entre outras, cobrindo toda a cadeia industrial, desde fabricantes de chips de armazenamento, design de controladores, fabrico de módulos e serviços em cloud. O summit, com fóruns de alto nível e uma exposição técnica em paralelo, evolui ao longo da tendência económica e de cenários de evolução, concentrando-se no rebentamento da procura de capacidade de armazenamento sob o aumento acentuado de tokens/KV Cache na era do Agent AI, e aprofunda discussões na transformação inovadora do armazenamento impulsionada por IA, abrangendo avanços tecnológicos em SSD PCIe 5.0/6.0, ultrapacidades de QLC e outras mudanças; em simultâneo, apresenta mais de cem produtos inovadores.

▍ A inferência de IA impulsiona a explosão da procura de armazenamento; desajustes estruturais tornam-se uma constante. Prevê-se que a situação de excesso de procura relativamente à oferta, pelo menos, continue até 2027; as subidas de preços atravessam todo o ano de 2026.

Lado da procura: segundo os dados do mercado chinês de flash da CFM, em 2026 as remessas de servidores aumentam 15% em termos homólogos; os servidores de IA, dentro do total de remessas de servidores, deverão ultrapassar 20%. À medida que os grandes modelos passam da fase de treino para a fase de inferência, a explosão de aplicações Agent faz disparar drasticamente o consumo de tokens. Quando o comprimento de sequência aumenta de 1k para 128k token, a ocupação de KV Cache sobe de 0,5 GB para 64 GB (BF/FP16, por pedido). Com longos contextos + elevada concorrência, a procura de armazenamento dispara linearmente com o volume de tokens e de concorrência. A CFM prevê que a capacidade de HBM em 2025/2026 aumente respetivamente mais de 90%/35% em termos homólogos; simultaneamente, com a descida da KV Cache e a escassez de fornecimento de HDD, a procura transborda e torna o eSSD o maior destino para NAND em 2026 (a participação sobe para 37%).

Lado da oferta: o desfasamento no ciclo de aumento de capacidade torna as subidas de preço de rutura uma tendência de longo prazo. Os fabricantes de armazenamento adotam, em geral, a estratégia de estabilizar os preços, destinando a capacidade avançada prioritariamente para produtos de armazenamento de IA com margens elevadas. Segundo a CFM, a proporção da capacidade de DRAM relativamente mais avançada, incluindo HBM/DDR5/LP5X/6, aumenta de menos de 50% em 2024 para 85%+ em 2026. Os processos maduros e a capacidade de consumo são continuamente comprimidos; os inventários da indústria caem de 10~12 semanas em outubro~dezembro de 2023 para 8~10 semanas em agosto~outubro de 2024, e em 2026 descem para 4 semanas, caindo abaixo da linha histórica de segurança. O ciclo de aumento de capacidade do armazenamento é de 18~24 meses; no 2.º semestre de 2026 não é possível aparecer uma viragem de oferta. A Himax Technologies acredita que 2027 é apenas o “momento mais escuro” das ruturas de armazenamento. A partir do 2.º semestre de 2025, os preços do armazenamento começam um aumento “épico”; a CFM prevê que o DRAM e o NAND ASP continuarão a subir ao longo de todo o ano de 2026. Na era da inferência de IA, a capacidade de armazenamento é o núcleo; o armazenamento atravessa uma mudança de paradigma de longo ciclo. Para o crescimento super, não é um simples repique cíclico.

▍ A cadeia da indústria de armazenamento acelera a reconstrução do valor.

No recente evento GTC, a NVIDIA destacou fortemente a “economia das fábricas de tokens”. O seu significado central é reforçar a posição estratégica do armazenamento na infraestrutura de IA, o que também implica que o teto de rentabilidade da indústria de armazenamento será aberto a longo prazo. De acordo com dados da CFM, o ASP do produto eSSD no 1.º trimestre de 2026 já é mais de 2 vezes o ASP do NAND de nível de consumo. Para os fabricantes de armazenamento, o ponto-chave está em fazer a atualização do meio e uma reconstrução a nível de arquitetura do sistema. Esta apresentação no fórum foca-se principalmente no mercado empresarial; para fornecedores de soluções de armazenamento, o foco da indústria passa de “quem é mais barato” para “quem consegue obter stock”. Ao mesmo tempo, empresas de topo como a Phison aceleram a transição para “módulos personalizados de alto valor acrescentado” capacitados com controladores desenvolvidos internamente, e expandem os SSDs de nível empresarial, para redefinir o valor do armazenamento e libertar-se do modelo tradicional de dependência de inventários de baixo custo.

▍ Tendência de armazenamento em cloud de IA (empresarial): explosão de QLC de grande capacidade e evolução acelerada das interfaces, a remodelar o motor de computação.

A IA está a acelerar a transição de “treino” para a fase de “inferência”. Prevê-se que a proporção futura entre servidores de inferência e servidores de treino chegue a 10:1 a 50:1. Atualmente, devido a um gargalo de largura de banda de armazenamento, a disponibilidade (taxa de utilização) dos clusters de GPU é apenas cerca de 46% a 50%. A atualização da memória de vídeo é a necessidade principal. Neste summit, vários fornecedores partilham ainda funcionalidades de redistribuição de recursos com cooperação entre computação e armazenamento; o papel do eSSD está a passar de “um contentor passivo de dados” para o papel central de “motor de computação” e de “camada de memória expansível”. Do lado do treino, com base em eSSD QLC de ultra grande capacidade para armazenar Checkpoints, é possível melhorar significativamente a eficiência operacional das GPU. Do lado da inferência, o eSSD assume tarefas como gestão de estados de contexto volumosos em camadas, consultas de bases de dados vetoriais e carregamento de fragmentos de modelos, através de caching em camadas KV Cache. Os dados de testes reais mostram que ao descarregar o KV cache para o SSD, e ao eliminar o cálculo de pré-preenchimento, é possível reduzir em 41 vezes o tempo de geração do primeiro token (TTFT). O armazenamento empresarial apresenta as seguintes tendências técnicas:

Face à necessidade de transbordo do cache para grandes volumes de dados de IA e KV Cache, a QLC de alta densidade torna-se o meio-chave; as soluções de QLC de ultra grande capacidade na escala de centenas de TB são a opção preferida. A Kioxia (245,76TB), a WDC (245TB) e a SanDisk (solução SN670 até 256TB) também apresentaram, em conjunto, produtos de ultra grande capacidade em níveis superiores a 200TB, otimizando grandemente a eficiência de espaço e o TCO.

Os chips do controlador caminham para “cooperação soft-hard”, colmatando as limitações do meio. Para cenários de inferência, a KV Cache traz leituras e escritas aleatórias de alta frequência e pressão de largura de banda; o controlador está a atualizar-se ativamente. A HiSilicon (PingTouDa) Zhengyue 510, com suporte nativo ao protocolo ZNS e cooperação a nível do sistema, apoia a comercialização em escala de QLC; o volume acumulado de envio ultrapassa 500 mil unidades. A Unisoc Technology introduz ainda tecnologias como motor de aceleração de KV e pré-busca preditiva, fazendo com que o controlador deixe de ser “operador de transporte de dados” e se torne um “gestor inteligente de recursos” ativo.

Iteração acelerada das interfaces e inovação em arrefecimento líquido, adaptadas a super clusters de cem mil GPUs. Diante da enorme procura de débito de dados de clusters de mil, dez mil e até cem mil placas, e dos desafios de elevada geração de calor e alta densidade. A Samsung demonstra SSDs NVMe PCIe 6.0 de 16 canais PM1763, com um aumento de 2,0 vezes no desempenho de entrada/saída. O controlador PCIe Gen6 “Lhotse” da FADU já está em fase de tape-out (fim de desenvolvimento), com desempenho sequencial de leitura a atingir 28,5GB/s.

▍ Tendências de armazenamento em terminais de IA (nível de consumo): aceleração de IA no dispositivo e fusão de computação e armazenamento a resolver o gargalo de ocupação de memória.

O ambiente do lado do terminal é extremamente exigente quanto ao custo do BOM de hardware, ao consumo de energia do sistema e à ocupação de memória DRAM; por isso, ao integrar “computação e armazenamento”, recorrer a escalonamento inteligente de software e hardware e a tecnologias avançadas de cache, transferir a pressão de inferência da memória (DRAM) para a memória flash (NAND) tornou-se uma importante complementação para ultrapassar o gargalo atual na implementação de grandes modelos no lado do dispositivo.

AI PC e grandes modelos locais: tecnologia Hybrid híbrida reduz a pressão de aumento explosivo da necessidade de capacidade de DRAM. Ao executar grandes modelos com dezenas ou centenas de milhares de milhões de parâmetros localmente no dispositivo, a memória é um grande desafio. A Jiangbo Ingrain lança uma unidade de processamento de armazenamento com SPU de 5nm e um agente de armazenamento iSA; na validação conjunta de ajuste fino, realiza a implementação local do modelo 397B no computador principal, e em cenários de contexto de 256K reduz em quase 40% a ocupação de DRAM; a Phison lança o Phison Hybrid AI SSD com a tecnologia aiDAPTIV+, prevendo reduzir mais de 50% do uso de DRAM, permitindo inferência local com custos controláveis e segurança.

Veículos inteligentes e computação de ponta: transição para arquitetura centralizada de pooling e uma base unificada de plataforma. A inteligência incorporada e a condução inteligente avançada exigem requisitos de coordenação global para a arquitetura subjacente. A XPeng Motors indica claramente que, com capacidades de computação até 2250 TOPS, a largura de banda de DRAM já se tornou o gargalo principal da latência de inferência; a era do carro com LPDDR6 está prestes a chegar, e o armazenamento de NAND a bordo do veículo está a mudar de ilhas separadas por domínio para pooling centralizado e software-defined.

Smartphones e AIoT (Internet das Coisas): aprofundamento de interfaces de alta velocidade e tecnologias avançadas de caching. Para exigências de velocidade de resposta e autonomia para dispositivos móveis e vestíveis emergentes, a Himax Technologies vai lançar o novo controlador UFS 4.1 SM 2755 e acelera o planeamento para mercados de AIoT como relógios e óculos inteligentes; a SanDisk utiliza a tecnologia de cache SmartSLC para alcançar alta taxa de transferência do funcionamento UFS 4.1 com apenas cerca de 2W de consumo; a Jiangbo Ingrain promove a implementação da tecnologia de cache avançada HLC no segmento embebido, para reduzir o custo do BOM do terminal.

▍ Fatores de risco:

Risco de uma economia macro global fraca; procura a jusante abaixo do esperado; inovação abaixo do esperado; risco de mudanças no ambiente industrial internacional e intensificação das fricções comerciais; risco de progresso da atualização da capacidade de computação abaixo do esperado; risco de gastos de capital dos fornecedores de cloud abaixo do esperado, etc.

▍ Estratégia de investimento:

Vemos valor na tendência da indústria de computação e armazenamento à medida que, na era do Agent AI, a capacidade de armazenamento aumenta; a computação próxima tem elevada conjuntura favorável. Damos preferência à cadeia industrial de HBM e CUBE. Além disso, com a escassez de armazenamento, o stock principal e também o de nicho enfrenta rutura e subidas de preço; múltiplos fornecedores indicam que o aumento no 2.º trimestre de 2026, em termos sequenciais (vs. anterior), ainda é semelhante. Prevemos que a situação de excesso de procura relativamente à oferta na indústria pelo menos se estenderá até ao final de 2027. Recomendação principal: empresas de módulos de armazenamento, com forte capacidade de explosão de resultados no curto prazo; fabricantes de armazenamento e empresas de design próximas dos fabricantes originais.

(Fonte: Jiemian News)

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar