As ações americanas de abril mergulharam em uma celebração estrutural liderada por IA, o índice Nasdaq disparou 15,3% no mês, o S&P 500 subiu 10,4%, e o índice de semicondutores de Filadélfia atingiu a maior alta mensal desde 2000. Após maio, o roteiro do mercado mudou rapidamente, com os três principais índices em alta, sob uma aparente calmaria, correntes subterrâneas agitadas: ARM, impulsionada pelos resultados financeiros positivos, disparou 42,58% em uma semana, a SanDisk, Seagate e outros líderes de armazenamento tiveram ganhos superiores a 15% em uma semana, enquanto as ações de Nvidia e Microsoft, antigas líderes de IA, caíram.

Isso é o fim da linha principal de IA ou uma troca interna profunda? Os fundos estão saindo de GPUs e gigantes de nuvem, migrando para arquitetura ARM e chips de armazenamento, o mercado parece estar negociando uma nova lógica de “pico de capacidade de treinamento, inferência na ponta e armazenamento como substitutos”. O Dow atingiu uma nova máxima, isso significa que a rotação de estilos já começou? A explosão da ARM é o ponto de partida para uma reavaliação de valor ou o pico de uma bolha de curto prazo?

Pontos importantes:

A febre de IA ainda não acabou, mas entrou em uma fase de diferenciação refinada: o fluxo de fundos continua, mas de uma expansão geral para apostas seletivas. Internamente, o mercado está migrando de GPUs e gigantes de nuvem para arquitetura ARM e chips de armazenamento, mudando a lógica de negociação para “pico de capacidade de treinamento, inferência na ponta e armazenamento como substitutos”.
O efeito de agrupamento de fundos é forte, mas o objeto do agrupamento está mudando: negociações quantitativas, opções de vencimento final e ETFs alavancados mudaram o ecossistema de mercado, e as ações de hedge aumentaram a volatilidade. O efeito de agrupamento não desapareceu, mas mudou de Nvidia para novos pontos quentes como ARM e SanDisk, levando a uma “alta que desafia a lógica”.
A explosão da ARM é uma típica operação de short squeeze, não sustentável: a compressão de gama e a compressão de vendedores a descoberto se sobrepõem, levando a uma alta rápida no preço das ações. Essa tendência não pode durar para sempre; uma vez que o interesse de compra se esgote ou o humor se abale, o preço pode inverter rapidamente, devendo-se ter extremo cuidado.
A arquitetura ARM tem vantagens essenciais na inferência na ponta: como um conjunto de instruções RISC, a eficiência energética da ARM é quase metade da x86; o modelo de licenciamento IP permite designs personalizados heterogêneos; a otimização de operações matriciais é mais compatível com modelos Transformer. O ponto de inflexão da indústria já se formou, mas a volatilidade de curto prazo é intensa.
Nvidia mantém uma posição sólida na inferência, mas enfrenta desafios: o ecossistema CUDA é uma barreira difícil de superar, sem concorrentes reais na fase de treinamento. Mas na inferência, chips próprios de AMD, Google e Microsoft, devido ao “cansaço do mercado com Nvidia”, têm oportunidades de crescimento. No futuro, a participação da Nvidia diminuirá, mas continuará sendo líder.
A carga de trabalho de inferência já superou a de treinamento, com previsão de representar de sete a oito dezenas por cento: atualmente, a relação de carga de inferência e treinamento é aproximadamente 6:4, mas o investimento de capital ainda é 60% em treinamento. Com a popularização de grandes modelos e o desenvolvimento de IA Agentic, além da desaceleração das iterações de treinamento, as demandas de custo, consumo de energia e latência na inferência criam novas oportunidades para ARM e chips de armazenamento.

Revisão do mercado: a celebração liderada por IA é o começo ou uma bolha?

Sun Cheng: A onda de alta liderada por IA acabou? Os fundos estão migrando de GPU/nuvem para ARM e armazenamento, qual é a força motriz por trás disso?

Mãe Cat: Desde 2023, o mercado de ações dos EUA já começou a focar na IA. A ação mais destacada de 2023 foi Nvidia, que é uma semicondutora, mas cujo principal motor é IA. Essa onda de mercado vem desde então, continuando até 2024 e 2025, com uma expansão em camadas e ritmo. Portanto, é prematuro dizer que a febre de IA acabou.

Com base nos dados mais recentes que monitoramos na última sexta-feira, o fluxo de fundos para IA ainda não mostra sinais de declínio. Mas há uma característica marcante: “diferenciação dentro da diferenciação”. Desde outubro do ano passado, o mercado geral entrou em um estado de estagnação, com movimentos horizontais de outubro a fevereiro. Durante esse período, algumas ações de software e grandes empresas de tecnologia impactadas pela IA mostraram sinais de fadiga e recuo. Mas, ao mesmo tempo, setores de alta tecnologia como armazenamento e comunicação óptica, que não caíram, na verdade subiram, refletindo uma diferenciação de mercado e foco de fundos.

Assim, olhando para o monitoramento de fundos, tanto novos investidores quanto investidores existentes continuam bastante ativos. Mas o mercado apresenta uma tendência contínua: dentro do grande setor de IA, os fundos estão constantemente buscando pontos quentes, diferenciações, novas temáticas e empresas de diferentes setores. Portanto, a onda de alta não terminou, mas entrou em uma fase de diferenciação mais refinada.

Sun Cheng: O Nasdaq e o S&P 500 atingiram o melhor desempenho mensal em quase seis anos, e o índice de semicondutores de Filadélfia teve a maior alta mensal desde 2000. Por trás dessas condições extremas, além do impulso da IA, como a recuperação do sentimento de mercado e o efeito de agrupamento de fundos se manifestam? Após meados de maio, o mercado não continuou em alta generalizada, isso indica uma mudança de “otimismo geral” para “apostas seletivas”? O efeito de agrupamento ainda existe?

Mãe Cat: Isso pode ser visto de duas formas. Por um lado, é uma típica tendência técnica do mercado de ações dos EUA. Geralmente, após longos períodos de lateralização ou queda, o mercado faz uma recuperação forte, como em 2020, ou após uma correção de três meses de agosto a outubro de 2023, uma alta quase de meio ano. Desde outubro do ano passado, o mercado geral dos EUA entrou em um estado de estagnação, com o centro de gravidade permanecendo inalterado por meses, uma típica consolidação de preparação. A última queda de março foi uma correção severa de avaliação, e 30 de março marcou o fundo dessa fase. Assim, a alta de abril é, na essência, uma recuperação dessa lateralização de quase seis meses. Uma característica marcante do mercado americano é “permanecer na jogada”, ou seja, você precisa ficar no jogo, pois a reversão pode acontecer em um ou dois dias. Estatísticas mostram que, nos últimos 50, 30 ou 10 anos, perder alguns desses dias de alta ou de forte recuperação ao longo do ano pode fazer uma grande diferença no retorno anual.

Por outro lado, o efeito de agrupamento de fundos ainda existe, mas o mercado atual é completamente diferente do passado. Negociações quantitativas, negociações por algoritmos, grande participação de investidores de varejo e uma enorme quantidade de opções e ETFs alavancados mudaram fundamentalmente o ecossistema de mercado. Para hedge, os formadores de mercado precisam tomar ações que aumentam a volatilidade, ajudando a impulsionar ou frear o mercado. Especialmente em ações de destaque de IA, todos os investidores de varejo estão negociando opções de vencimento final, enquanto grandes investidores (com grande volume de fundos e influência no mercado) também perseguem esses pontos quentes. Isso acelera os movimentos de alta e baixa, tornando o efeito de agrupamento de fundos cada vez mais forte, com fenômenos de “alta que desafia a lógica”. Portanto, o mercado não mudou de otimista para pessimista, mas o objeto do agrupamento mudou, os fundos continuam concentrados, apenas trocaram de ativos.

Sun Cheng: A ação da ARM disparou mais de 42% em uma semana, uma alta tão grande em apenas dois dias de negociação. Isso já pode ser considerado uma operação de “short squeeze” tecnicamente? Existe influência de sentimento de investidores de varejo ou de compressão de gama de opções? Essa velocidade de alta é sustentável?

Mãe Cat: Isso é realmente uma operação típica de short squeeze, na qual a compressão de gama desempenha papel importante. No mercado de ações dos EUA, quando um ponto quente surge, todas as instituições, grandes investidores e investidores de varejo estão perseguindo. A presença massiva de opções de vencimento final causa problemas de compressão de gama. Muitos formadores de mercado não apostam na direção, mas lucram com a diferença de preço. Quando a maioria dos participantes compra opções de vencimento final ou opções de compra fora do dinheiro próximas ao preço, os formadores de mercado enfrentam risco enorme: se a ação sobe, precisam cumprir as opções, e para fazer hedge (manter delta neutro), precisam comprar ações em grande quantidade. Quanto mais compram, mais ações os formadores precisam adquirir, empurrando o preço para cima de forma frenética. Muitos efeitos de final de sessão de 30 minutos que vimos recentemente são causados por essa compressão. Ao ver o preço sendo empurrado para cima repetidamente, investidores empolgados continuam comprando mais opções de compra, o que força os formadores de mercado a comprar ações para hedge.

Há também a compressão de vendedores a descoberto. Alguns investidores acreditam que o preço está muito além do valor, e entram em posições vendidas, mas, devido ao mecanismo acima, o preço continua subindo, forçando os vendedores a liquidar suas posições e comprar ações, formando uma pressão de força contrária. No caso da ARM, se esse movimento durar mais tempo e a curva ficar mais íngreme, pode se tornar um típico short squeeze.

Quanto à sustentabilidade, tecnicamente, esse tipo de movimento não pode durar para sempre. Assim que todos os vendedores a descoberto se rendem ou o sentimento de compra dos novos investidores se abala com a volatilidade, o mercado perde sua resistência e o preço pode inverter rapidamente, com lucros sendo realizados ou com o humor do mercado se tornando hesitante. Como na alta, há efeito acumulado, portanto, é preciso ter extremo cuidado.

Análise profunda de tecnologia de IA: ascensão da ARM, pressão sobre Nvidia, armazenamento como substituto

Sun Cheng: A ARM disparou 42,58% na semana passada, e a lógica central do mercado é “de IA de treinamento para inferência na ponta, arquitetura ARM se beneficiará significativamente”. Por favor, analise do ponto de vista técnico: quais são as vantagens essenciais do conjunto de instruções e do modelo de licenciamento da ARM na inferência de IA em comparação com x86? Essa rodada de reavaliação de valor é catalisada por resultados financeiros de curto prazo ou por um ponto de inflexão de longo prazo na indústria?

Wang Huai: Do ponto de vista técnico, a mudança para aplicações de IA com foco na inferência na ponta é bastante clara. A ARM é mais adequada para a ponta por três razões principais:

Primeiro, vantagem do conjunto de instruções. A ARM é RISC (conjunto de instruções reduzido), enquanto a x86 é CISC (conjunto de instruções complexo). RISC não precisa de pipelines excessivamente complexos, permitindo integrar mais núcleos, caches ou unidades de aceleração dedicadas na mesma área de chip, favorecendo cálculos próximos à memória. Na inferência de IA, um gargalo importante é a comunicação de memória. A ARM possui IP físico flexível e capacidade de customização, sendo naturalmente adequada para operações de inferência de IA. Em cargas típicas na ponta, a arquitetura ARM tem eficiência energética significativamente superior à x86, com consumo de energia quase metade, trazendo vantagens de custo enormes.

Segundo, vantagem do modelo de licenciamento. A ARM opera por IP licenciado, permitindo que clientes façam designs customizados após obter a licença, por exemplo, combinando CPU com GPU e NPU, com liberdade de operação. A x86 é uma “caixa preta”, difícil de otimizar heterogeneamente. Essa abertura torna a ARM mais atraente na integração de memória de alta largura de banda (LPDDR).

Terceiro, otimização de operações matriciais. As operações de matriz, especialmente usadas em modelos Transformer, são muito mais eficientes na ARM do que na x86. Embora a x86 também possa fazer matrizes de forma eficiente, alcançar a mesma eficiência de throughput e área é mais difícil do que com as soluções vetoriais da ARM, especialmente na ponta. Se a compatibilidade e maturidade forem prioridade, a x86 é uma escolha; se o foco for custo-benefício e consumo de energia (com impacto de longo prazo), a ARM tem vantagem clara.

Do ponto de vista de tendências industriais, a IA está mudando de treinamento para inferência, especialmente com o desenvolvimento de IA Agentic (agente). Isso não é só diálogo com grandes modelos, mas envolve muitas chamadas de API, redes e arquivos, que dependem de CPU. Como CPU, a ARM é promissora na aplicação de IA Agentic na ponta (PC, celular, automóveis). A direção geral está clara, o ponto de inflexão na indústria já se formou, mas a volatilidade de curto prazo será intensa; a consolidação de longo prazo reforçará o valor dessas direções.

Sun Cheng: Nvidia caiu 2,58% na semana passada, preocupando-se com desaceleração de crescimento. AMD subiu 3,60%. No campo de chips de IA, o ecossistema CUDA da Nvidia ainda é uma barreira forte? Os GPUs MI da AMD podem reduzir a diferença na inferência? Chips próprios de clientes representam uma ameaça significativa à Nvidia?

Wang Huai: No lado de treinamento, ninguém consegue desafiar a Nvidia atualmente. Mas, com a popularização de grandes modelos e o desenvolvimento de IA Agentic, a demanda por capacidade de inferência aumentou bastante, criando oportunidades para outros players. A inferência exige arquiteturas heterogêneas de CPU, GPU, NPU, com requisitos de memória elevados. Isso dá uma chance real para AMD e outros.

A AMD certamente se beneficiará do sentimento de “cansar da Nvidia”. Empresas precisam de um segundo fornecedor confiável para garantir a segurança da cadeia de suprimentos, evitando dependência de um único fornecedor. Assim, sempre que um segundo fornecedor viável aparecer, os clientes tendem a favorecer. A receita de data center da AMD cresce, mas o valor de mercado ainda está muito abaixo do aumento de preço das ações, refletindo emoções, mas também uma oportunidade real de mercado na inferência.

Para a Nvidia, as vendas na inferência podem ser impactadas, mas não de forma fatal. A barreira do ecossistema CUDA não será facilmente superada em poucos dias. Google, Microsoft e Amazon também estão desenvolvendo seus próprios chips de inferência, para reduzir dependência de fornecedores únicos e fazer designs heterogêneos personalizados. Essa tendência é clara. Mas os chips mais versáteis e de maior compatibilidade ainda são da Nvidia. Nos próximos dois a três anos, mesmo na inferência, a Nvidia continuará dominando, embora sua concentração de mercado seja menor do que na fase de treinamento. No curto prazo, não há concorrentes substanciais na fase de treinamento.

Sun Cheng: O mercado acredita que o investimento em IA está mudando de “capacidade de treinamento” para “aplicações de inferência”. Na prática, qual é a proporção atual de carga de trabalho de treinamento versus inferência globalmente? Como essa proporção deve evoluir nos próximos dois anos? Essa mudança traz novos desafios tecnológicos para design de chips, largura de banda de armazenamento, consumo de energia, etc.?

Wang Huai: Pesquisando alguns relatórios, a proporção de carga de trabalho de inferência e treinamento atualmente é aproximadamente 6:4 ou 5,5:4, com inferência já superando o treinamento. Mas o investimento de capital (Capex) é o inverso: o treinamento ainda representa cerca de 60%, enquanto a inferência fica em 40%, pois o custo de nós de supercomputadores para treinamento é maior.

No futuro, a proporção de inferência deve aumentar significativamente. Por um lado, a adoção de grandes modelos ainda é baixa globalmente; dados indicam que 86% da população mundial nunca usou um grande modelo. Além da China e EUA, muitos países têm pouca aplicação de grandes modelos. Por outro lado, a IA Agentic aumentará drasticamente as chamadas a grandes modelos. Nos próximos três a cinco anos, é totalmente plausível que a inferência represente de sete a oito dezenas por cento da carga de trabalho.

Outro fator é que a velocidade de iteração do treinamento está desacelerando bastante. Empresas capazes de treinar grandes modelos estão se concentrando, e cada vez menos empresas podem arcar com esses custos. Com menos competição, as empresas preferem monetizar modelos existentes, ao invés de lançar novos rapidamente. Assim, a demanda por capacidade de treinamento diminui. A menos que haja avanços revolucionários em treinamentos de nível de Nankai ou modelos de mundo, essa variável pode mudar.

Essa mudança de treinamento para inferência impõe requisitos mais altos no design de chips. A inferência é altamente sensível a custo, energia e latência, além de precisar se adaptar a cenários diversos, do cloud à ponta. Isso abre oportunidades para diferentes arquiteturas (GPU, ASIC, CPU). As demandas por largura de banda de memória e cache de contexto (KV Cache) também são maiores do que na fase de treinamento. Esses desafios tecnológicos oferecem oportunidades de mercado para arquiteturas como ARM e chips de armazenamento.

NAS100-0,08%

SPYX0,05%

ARM5,61%

SNDK0,41%

Ver original

Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.

Recompensa
curtir
Comentário
Repostar
Compartilhar

Comentário

Adicionar um comentário

Sem comentários

Tendências
Ver projetos
#
WinGoldBarsWithGrowthPoints
1.22M Popularidade
#
WTICrudeFallsBelow90Dollars
1.18M Popularidade
#
IsraelStrikesIranBTCPlunges
51.36K Popularidade
#
StockTradingChallengeUpTo17000U
191.07K Popularidade
#
USIranNegotiationGame
9.41M Popularidade

Fixado

sitemap

Quando terminará a tendência de alta das ações americanas de "Viva os Chips"

Pontos importantes:

Revisão do mercado: a celebração liderada por IA é o começo ou uma bolha?

Análise profunda de tecnologia de IA: ascensão da ARM, pressão sobre Nvidia, armazenamento como substituto

Tendências

WinGoldBarsWithGrowthPoints

WTICrudeFallsBelow90Dollars

IsraelStrikesIranBTCPlunges

StockTradingChallengeUpTo17000U

USIranNegotiationGame

Fixado