CITIC Securities: Continuação da perspetiva otimista sobre a tendência de crescimento da inovação em armazenamento

O relatório de pesquisa da CICC afirma que, na era da Agent AI, a capacidade de armazenamento é o núcleo, impulsionando a indústria de armazenamento a atravessar uma transferência de paradigma de longo ciclo. Do lado da oferta e da procura, a inferência de IA faz com que o consumo de tokens aumente de forma acentuada; a KV Cache também aumenta de forma linear, e a explosão da procura, desalinhada com a expansão de capacidade dos fabricantes originais, torna a falta de stock uma constante. Prevê-se que a situação de excesso de procura sobre oferta se mantenha até 2027, e que a subida de preços se estenda por todo o ano de 2026. Do ponto de vista técnico, no contexto de escassez extrema e custos elevados de HBM e DRAM, os fabricantes partilham soluções de inovação em NAND para aliviar a pressão da procura de capacidade de memória. A CICC continua a mostrar-se particularmente otimista quanto à tendência de crescimento impulsionada pela inovação em armazenamento.

Segue o texto integral

Armazenamento|A partir do Flash Memory Summit, observar as tendências de desenvolvimento do armazenamento

Na era da Agent AI, a capacidade de armazenamento é o núcleo, impulsionando a indústria de armazenamento a atravessar uma transferência de paradigma de longo ciclo. Do lado da oferta e da procura, a inferência de IA faz com que o consumo de tokens aumente acentuadamente; a KV Cache aumenta, por sua vez, de forma linear. A explosão da procura, desalinhada com a expansão de capacidade dos fabricantes originais, provoca uma normalização da escassez de stock. Prevê-se que a situação de excesso de procura sobre oferta se mantenha até 2027, e que a subida de preços se estenda por todo o ano de 2026. Do ponto de vista técnico, no contexto de escassez extrema e custos elevados de HBM e DRAM, os fabricantes partilham soluções de inovação em NAND, aliviando a pressão da procura de capacidade de memória. Continuamos a mostrar-nos otimistas quanto à tendência de crescimento impulsionada pela inovação em armazenamento.

Em 2026, realiza-se o China Flash Memory Market Summit, com foco na inovação de armazenamento na era da IA e nas oportunidades de atualização da cadeia de indústria.

Em 27 de março de 2026, o evento anual CFMS MemoryS 2026 da indústria global de armazenamento realiza-se em Shenzhen. Como um summit de referência para o setor, a edição deste ano tem como tema central “Atravessar o ciclo, libertar valor”, concentrando-se em profundidade na inovação tecnológica e na coordenação de atualizações da cadeia de indústria, atraindo dezenas de empresas globais líderes, como Samsung Electronics, Hynix, Kioxia, Solidigm, Intel, Tencent Cloud, entre outras, cobrindo todos os elos da cadeia industrial, desde fabricantes de chips de armazenamento, design de controladores, fabrico de módulos, a serviços em cloud. O summit realiza-se com fóruns de alto nível e exposições tecnológicas em modo paralelo; ao longo da evolução, são abordadas perspectivas de tendências de conjuntura, com foco na explosão da procura de capacidade de armazenamento sob o cenário de forte crescimento de tokens/KV Cache na era da Agent AI. Discutem-se em profundidade mudanças de inovação de armazenamento impulsionadas por IA, incluindo avanços técnicos de SSDs PCIe 5.0/6.0, breakthroughs em tecnologia QLC de capacidades ultra-elevadas e outras transformações, com apresentação simultânea de mais de uma centena de produtos inovadores.

▍ A inferência de IA impulsiona uma explosão da procura de armazenamento; desajuste estrutural torna-se uma constante. Prevê-se que a situação de excesso de procura sobre oferta se mantenha, pelo menos, até 2027, e que a subida de preços percorra todo o ano de 2026.

Do lado da procura: de acordo com os dados do mercado de memórias flash CFM China, em 2026 as remessas de servidores aumentarão ano contra ano +15%; a percentagem de servidores de IA no total de remessas de servidores ultrapassará 20%. À medida que os grandes modelos avançam da fase de treino para a fase de inferência, a explosão de aplicações Agent faz com que o consumo de tokens aumente drasticamente. Quando o comprimento de sequência sobe de 1k para 128k tokens, a ocupação da KV Cache aumenta de 0,5GB para 64GB (BF/FP16, por pedido). Com contexto de longa duração + elevada concorrência, a procura de armazenamento aumenta em linha com o token/volume de concorrência, de forma linear e acelerada. A CFM prevê que a capacidade de HBM em 2025/2026 aumente, respectivamente, ano contra ano +90%/+35% ou mais; ao mesmo tempo, a descida da KV Cache, combinada com a escassez de fornecimento de HDD e o transbordo da procura, impulsiona o eSSD a tornar-se o maior downstream de NAND em 2026 (a sua quota sobe para 37%).

Do lado da oferta: o desfasamento do ciclo de expansão de capacidade fará com que a escassez e a subida de preços se mantenham no longo prazo. Os fabricantes originais de armazenamento, em geral, adotam estratégias de estabilização de preços, colocando a capacidade avançada primeiro em produtos de armazenamento de IA com margens mais elevadas. De acordo com a CFM, a proporção de capacidade de DRAM relativamente mais avançada, incluindo HBM/DDR5/LP5X/6, aumentou de menos de 50% em 2024 para 85%+ em 2026. Processos maduros e capacidades de consumo são continuamente comprimidos. O inventário da indústria diminuiu de 10~12 semanas em 2023, para 8~10 semanas em 2024, e para 4 semanas em 2026, descendo abaixo das linhas históricas de segurança. O ciclo de expansão de capacidade em armazenamento é de 18~24 meses; não é possível que, no segundo semestre de 2026, apareça uma viragem na oferta. A Kioxia, segundo a empresa, a 2027 será o “momento mais negro” da escassez de armazenamento. A partir da segunda metade de 2025, os preços do armazenamento entram numa subida a nível “épico”; a CFM prevê que o DRAM e o NAND ASP vão manter aumentos ao longo de 2026. Na era da inferência de IA, a capacidade de armazenamento é o núcleo; o armazenamento atravessa uma transferência de paradigma de longo ciclo. Para um crescimento super, não é apenas um repique cíclico.

▍ A cadeia industrial de armazenamento acelera a reconfiguração do valor.

No recente evento GTC, a NVIDIA destacou em particular a “economia das Token Factories”, cujo significado central é reforçar a posição estratégica do armazenamento na infraestrutura de IA, o que também implica que o teto de rentabilidade da indústria de armazenamento será aberto de forma duradoura. De acordo com dados da CFM, o ASP do produto eSSD no 26Q1 já atingiu mais do que o dobro do ASP de NAND de nível de consumo. Para os fabricantes de armazenamento, o essencial é fazer uma atualização do meio (media) e uma reconfiguração ao nível da arquitetura do sistema. Nesta intervenção do fórum, o foco principal está no mercado empresarial. Para os fornecedores de soluções de armazenamento, o foco do setor passa de “quem é mais barato” para “quem consegue obter stock”; ao mesmo tempo, empresas líderes como Phison Electronics aceleram a transição para módulos “customizados” de alto valor acrescentado com controladores desenvolvidos internamente, e expandem SSDs empresariais, redefinindo o valor do armazenamento e libertando-se do modelo tradicional de depender de stocks baratos de baixo custo.

▍ Tendência do armazenamento em cloud de IA (empresarial): explosão de QLC de grande capacidade e evolução relâmpago de interfaces, a remodelar o motor de computação.

A IA está a acelerar a transição de “treino” para “inferência”. No futuro, a proporção entre servidores de inferência e servidores de treino deverá atingir de 10:1 até 50:1. Actualmente, devido a um gargalo de largura de banda do armazenamento, a disponibilidade (utilização) dos clusters de GPU é apenas cerca de 46% a 50%. A actualização de memória (VRAM) tornou-se a procura central. Além disso, neste summit, vários fabricantes partilharam funções de redistribuição de capacidades com coordenação entre computação e armazenamento. O papel do eSSD evolui de “contentor passivo de dados” para um “motor de capacidade de computação” essencial e uma “camada de memória de expansão”: no lado do treino, ao basear-se em eSSD QLC de capacidade extremamente elevada para armazenar Checkpoints, é possível melhorar significativamente a eficiência de execução das GPU; no lado da inferência, o eSSD assume tarefas como gestão do estado de contexto massivo de longa duração, consultas de bases de dados vectoriais e carregamento de partições do modelo através de caching em camadas da KV Cache. Dados de testes reais mostram que, ao descarregar o KV cache para o SSD e eliminar o cálculo de pré-preenchimento, pode reduzir em 41 vezes o tempo de geração do primeiro token (TTFT). O armazenamento empresarial está a apresentar as seguintes tendências tecnológicas:

Perante a necessidade de transbordo de caching de enormes volumes de dados de IA e KV Cache, o QLC de alta densidade torna-se um meio crítico; soluções QLC de ultra grande capacidade na ordem das centenas de TB tornam-se a escolha preferida. A Kioxia (245,76TB), a Great Micro (245TB) e a SanDisk (solução SN670 até 256TB) também apresentaram produtos QLC de ultra grande capacidade acima de duzentos TB, otimizando de forma significativa a eficiência de espaço e o TCO.

Os chips de controlador evoluem para “coordenação entre soft e hard”, colmatando as lacunas do meio. Para cenários de inferência, em que a KV Cache gera leituras e escritas aleatórias de alta frequência e pressão na largura de banda, o controlador está a actualizar-se activamente. O Tetragon, o controlador ZNS da PingTouGe, suporta nativamente o protocolo ZNS e, com coordenação ao nível do sistema, ajuda na comercialização em escala do QLC; o volume acumulado de envio ultrapassa 500 mil unidades. A Unis, a Lienda, introduziu tecnologias como motor de aceleração de KV e prefetch preditivo, permitindo que o controlador deixe de ser um “transportador de dados” e se transforme num “gestor inteligente de recursos” ativo.

Evolução acelerada das interfaces e inovação em arrefecimento líquido, adaptando-se a clusters gigantes de 100 mil GPUs. Para enormes desafios de throughput de dados em clusters de milhares, dezenas de milhares e até 100 mil GPUs e o calor de alta densidade. A Samsung demonstrou discos SSD PCIe 6.0 de 16 canais PM1763; o desempenho de entrada/saída melhora de forma superior em 2,0 vezes. O controlador PCIe Gen6 “Lhotse” da FADU já está em fita, com desempenho de leitura sequencial a atingir 28,5GB/s.

▍ Tendência do armazenamento em terminais de IA (consumo): aceleração de IA no dispositivo com implementação, e integração do armazenamento e da computação para resolver o gargalo de ocupação de memória.

O ambiente nos terminais é extremamente exigente quanto ao custo do BOM de hardware, consumo de energia do sistema e ocupação de memória DRAM. Por isso, transferir a pressão de inferência da memória (DRAM) para o armazenamento (NAND) através de “integração de armazenamento e computação”, agendamento inteligente de software e hardware e tecnologias avançadas de caching, tornou-se um complemento importante para ultrapassar o gargalo de implementação de grandes modelos nos terminais.

AI PC e grandes modelos locais: tecnologia Hybrid híbrida reduz a pressão de aumento explosivo da necessidade de DRAM. Ao executar grandes modelos com dezenas de milhares de milhões ou mil milhões de parâmetros nos terminais, a memória é um desafio enorme. A JiangboLong lançou unidades de processamento de armazenamento com SPU de 5nm e agentes de armazenamento iSA; na validação de afinação conjunta, foi possível implementar localmente o modelo 397B no host PC, e em cenários de contexto de 256K reduzir a ocupação de DRAM em quase 40%. A Phison Electronics lançou o Phison Hybrid AI SSD e a tecnologia aiDAPTIV+, prevendo reduzir em mais de 50% o uso de DRAM, permitindo inferência local com custos controláveis e segurança.

Veículos inteligentes e computação de ponta: avanço para arquitetura de central pooling e base de plataforma unificada. A inteligência corporificada e a condução inteligente de nível superior colocam exigências de coordenação global na arquitetura de base. A XPeng Motors indicou claramente que, com capacidade de computação máxima de até 2250 TOPS, a largura de banda da DRAM já se tornou o gargalo central para a latência de inferência; a era do car LPDDR6 está a chegar, e o armazenamento NAND automóvel está a passar de ilhas separadas por domínio para central pooling e software-defined.

Smartphones e IoT para IA: interface de alta velocidade e caching avançado aprofundam-se. Para requisitos de velocidade de resposta e autonomia de bateria em dispositivos móveis e em dispositivos vestíveis emergentes, a Hynix vai lançar em breve o novo controlador UFS 4.1 SM 2755 e acelerar a estruturação no mercado de AIoT como smartwatches e óculos inteligentes. A SanDisk adopta a tecnologia SmartSLC para obter execução de alta taxa de transferência de UFS 4.1 com apenas cerca de 2W de potência. A JiangboLong também promove a implementação da tecnologia HLC avançada de caching no lado embebido, para reduzir o custo do BOM do terminal.

▍ Factores de risco:

Risco de debilidade da economia macro global; procura a jusante inferior ao esperado; inovação inferior ao esperado; risco de mudanças no ambiente da indústria internacional e intensificação de atritos comerciais; risco de que a progressão de atualização de capacidade de computação não corresponda ao esperado; gastos de capital dos fornecedores de cloud não correspondem ao esperado, etc.

▍ Estratégia de investimento:

Nós mostramos-nos otimistas quanto à tendência na cadeia de armazenamento e computação com a melhoria da capacidade de armazenamento na era da Agent AI. A computação próxima tem uma conjuntura muito favorável; e estamos otimistas quanto à cadeia de HBM e CUBE. Ao mesmo tempo, com a escassez de armazenamento, o stock principal até ao nicho está completamente sem stock e os preços estão a aumentar. Vários fabricantes reportaram que o aumento do 26Q2 face ao trimestre anterior continua semelhante; prevemos que o excesso de procura sobre oferta se mantenha, pelo menos, até ao final de 2027. Recomendação central: empresas de módulos de armazenamento, com forte capacidade de explosão de resultados no curto prazo; fabricantes originais de armazenamento e empresas de design próximas dos fabricantes originais.

(Fonte: Jiemian News)

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar