Entrevista com o CEO da Micron: "Armazenamento" é o gargalo negligenciado da IA, a escassez de oferta pode se estender até após 2026

robot
Geração do resumo em andamento

Autor do artigo: Li Jia

Fonte do artigo: Wall Street Journal

「A competição de IA não é apenas uma corrida de poder de processamento, mas também uma competição de armazenamento。」 O CEO da Micron Technology, Sanjay Mehrotra, fez essa avaliação.

No podcast "A Bit Personal" em 5 de junho, Sanjay participou de uma entrevista profunda rara gravada em sua casa. Além das percepções habituais do setor, essa conversa com um toque pessoal também o levou a falar abertamente sobre sua trajetória de crescimento, influências familiares e escolhas profissionais.

A IA ainda está em estágio muito inicial, essa é uma das avaliações mais centrais de Sanjay.

Na visão dele, à medida que modelos grandes, agentes de IA e aplicações de raciocínio continuam evoluindo, a IA precisa de mais do que apenas maior poder de processamento; ela também precisa de uma maior "capacidade de memória".

Janelas de contexto mais longas, modelos de maior escala e o consumo crescente de tokens estão impulsionando a demanda por armazenamento de forma contínua.

A essência da IA é dados, e dados dependem de armazenamento, portanto, o armazenamento se tornará uma das infraestruturas mais importantes na melhoria das capacidades de IA.

Ao mesmo tempo, a oferta não está suficientemente preparada. Sanjay apontou que o setor de armazenamento atualmente enfrenta não uma simples discrepância de oferta e demanda de curto prazo, mas restrições estruturais de oferta. Produtos avançados de armazenamento consomem mais wafers, e construir novas fábricas de wafers geralmente leva de três a quatro anos, com uma escalada de capacidade igualmente longa posteriormente.

Mais importante ainda, com o avanço dos nós tecnológicos, o aumento na capacidade de armazenamento por wafer está diminuindo. Ele acredita que a escassez de oferta no setor pode persistir até após 2026.

Ao explicar por que a tecnologia de armazenamento foi subestimada por tanto tempo, Sanjay afirmou abertamente: "As pessoas frequentemente confundem memória com outros componentes, não sabem o quão difícil é fabricar memória." Desde física, química até ciência de materiais, garantir que cada um dos trilhões de bits produzidos em produção em massa funcione corretamente é uma tarefa de alta complexidade técnica. Ele acredita que a competição de IA também é uma competição de armazenamento, e esse fato tem sido negligenciado pelo mercado por muito tempo.

De uma perspectiva mais de longo prazo, Sanjay acredita que a lógica fundamental do sucesso de empresas e indivíduos não mudou. Seja impulsionando um plano de investimento de 200 bilhões de dólares ou liderando a Micron através dos ciclos do setor de armazenamento, as palavras-chave que ele repete são resiliência, disciplina e visão de longo prazo. Investimentos devem ser baseados em dados e fundamentos, e líderes precisam entender claramente as tendências do setor, além de aprofundar-se nos detalhes técnicos.

Assim como aprendeu com seu pai, o sucesso exige tanto perseverança quanto a capacidade de aproveitar oportunidades nos momentos críticos.

Os principais pontos da entrevista com o CEO da Micron, Sanjay Mehrotra, são os seguintes:

O armazenamento é o gargalo subestimado da IA, cuja dificuldade de fabricação e valor estratégico estão muito além do que o mercado reconhece. A IA está se estendendo de uma "corrida de poder de processamento" para uma "corrida de armazenamento". A expansão do tamanho dos modelos, o aumento da janela de contexto e o consumo explosivo de tokens fazem com que a IA dependa não apenas de maior poder de processamento, mas também de uma maior "capacidade de memória". Sem armazenamento suficiente e largura de banda, nem o maior poder de processamento pode ser totalmente aproveitado.

As restrições estruturais na oferta determinam que a escassez de armazenamento não é uma flutuação de curto prazo, mas um estado de longo prazo. Produtos avançados de armazenamento consomem mais wafers, e novas fábricas de wafers levam de três a quatro anos para serem construídas, com uma escalada de capacidade igualmente longa. Além disso, o avanço dos nós tecnológicos está reduzindo o aumento na produção por wafer. Com a discrepância entre oferta e demanda, a escassez de fornecimento deve persistir pelo menos até após 2026.

As pessoas sempre subestimam a dificuldade de fabricar memória, mas essa é justamente a barreira mais profunda do setor. Desde física, química até ciência de materiais, garantir que cada um dos trilhões de bits funcione sem erro em produção em massa é uma tarefa de complexidade técnica extrema. A dificuldade de fabricação de chips de armazenamento é comparável à de qualquer outro semicondutor, e muitas vezes até mais difícil.

O sucesso vem de resiliência, disciplina e visão de longo prazo, e não de julgamentos de tendências de curto prazo. Seja impulsionando um investimento de 200 bilhões de dólares ou atravessando ciclos do setor de armazenamento, os líderes precisam entender as tendências do setor e aprofundar-se nos detalhes técnicos. Assim como seu pai, que não desistiu após ser rejeitado três vezes no visto, o sucesso exige tanto perseverança quanto a habilidade de aproveitar oportunidades nos momentos certos.

O armazenamento está se tornando a espinha dorsal da IA

Ao falar sobre a posição atual do setor de armazenamento na história, Sanjay afirmou abertamente: "Tenho mais de 45 anos neste setor. Este é o momento mais empolgante que já vivi na minha carreira."

Ele explicou ainda a importância estratégica do armazenamento para a IA:

"Sem semicondutores, não há IA. E o armazenamento é a espinha dorsal da IA, sendo a base fundamental que sustenta a evolução contínua da IA."

Para ele, o papel do armazenamento não é mais apenas uma peça dentro de um dispositivo, mas sim uma carga direta da "inteligência" em si: "Hoje, o armazenamento não é apenas para fazer o dispositivo funcionar, ele está sustentando a própria 'inteligência' da IA, ajudando a tornar a inteligência artificial mais inteligente."

À medida que o tamanho dos modelos aumenta, a demanda por raciocínio explode e os agentes de IA (Agent AI) surgem rapidamente, a lógica do crescimento da demanda por armazenamento fica bastante clara para Sanjay: "À medida que os modelos ficam maiores, a demanda por raciocínio aumenta continuamente, a IA evolui do treinamento para a inferência, do data center para a borda — a necessidade de armazenamento só vai crescer, exigindo maior capacidade, desempenho superior e menor consumo de energia."

Ele também destacou a dependência do armazenamento na economia de tokens: "Quando olhamos para a economia de tokens, ela também depende fortemente do armazenamento. Com o aumento do uso de tokens, a janela de contexto fica maior, a demanda por cache KV aumenta, e o próprio modelo fica maior — a IA precisa de mais do que apenas capacidade de cálculo, ela precisa 'lembrar'."

A escassez de oferta deve persistir até após 2026

Para a questão mais preocupante do mercado, a oferta e demanda, Sanjay deu uma avaliação clara: a escassez de oferta no setor deve continuar até após 2026, e por um período bastante longo.

Ele explicou as restrições estruturais na oferta: "Construir uma fábrica de wafers leva muito tempo. Desde o início da construção até a produção do primeiro wafer, geralmente leva de três a quatro anos. Depois, é preciso continuar escalando a produção, aumentando gradualmente a capacidade."

Mais importante, o aumento na dificuldade técnica está comprimindo a eficiência de produção por wafer: "Cada nova geração de tecnologia traz uma melhoria na eficiência de produção, ou seja, o aumento de bits por wafer, está diminuindo."

Sanjay revelou que a Micron já previa essa tendência por volta de 2021.

Naquela época, a participação de armazenamento de alta largura de banda (HBM) no setor ainda era inferior a 1%, mas eles já previam que várias gerações futuras de HBM consumiriam uma quantidade enorme de silício, impactando significativamente o cenário de oferta: "Por isso, em 2021, já dissemos que o setor precisaria construir novas fábricas de wafers do zero. Mas ninguém previu a velocidade com que a IA iria explodir."

Quanto à preocupação de que a oferta possa superar a demanda e gerar excesso de capacidade, Sanjay não descartou completamente, mas reforçou que a IA ainda está em estágio inicial, e o crescimento estrutural de longo prazo na demanda é a base de sua confiança: "Do lado da demanda, tudo ainda está em uma fase muito inicial. Acreditamos que a IA ainda tem um longo caminho a percorrer."

A lógica por trás do investimento de 200 bilhões de dólares: disciplina

Anunciando um investimento de 200 bilhões de dólares nos EUA para construir uma cadeia de produção de armazenamento, a Micron tomou uma das decisões de capital mais comentadas do setor de semicondutores nos últimos anos. Quanto à lógica fundamental dessa decisão, Sanjay enfatizou repetidamente a palavra "disciplina":

"Investimento nunca é feito de forma cega, deve ser disciplinado e baseado em dados. Você precisa entender a tecnologia, entender as aplicações, e para onde essas aplicações estão indo. Você também precisa trabalhar de perto com os clientes, entender para onde eles querem ir e qual papel a Micron desempenhará nisso."

Ele explicou ainda a disciplina na execução: "Hoje, estamos investindo na construção de várias fábricas de wafers do zero. A primeira etapa é construir as fábricas e a infraestrutura básica. Quando essas fábricas estiverem prontas, ao instalar os equipamentos e formar a capacidade real, manteremos a disciplina — avaliando continuamente as previsões de demanda, o avanço tecnológico e como a demanda por produtos vai evoluir."

Quando questionado se já teve dúvidas sobre o próprio caminho, Sanjay respondeu de forma direta:

"Não temos dúvidas. Acreditamos absolutamente na oportunidade do armazenamento, e isso já está muito claro hoje. Claro que, no nosso negócio, é sempre importante manter a capacidade de adaptação e agilidade."

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado