Goldman Sachs: O que o DeepSeek V4 significa para a IA na China?

Autor: Bao Yilong, Wall Street Insights

Goldman Sachs considera que, o significado central do DeepSeek V4 reside em suportar aplicações de agentes mais complexos com custos mais baixos, abrindo assim um novo espaço para a escalabilidade das aplicações de IA.

Em 24 de abril, a equipe de Ronald Keung, do Goldman Sachs, publicou um relatório de pesquisa, afirmando que o novo modelo de código aberto V4 é uma continuação da rota de eficiência prioritária e de código aberto do DeepSeek.

Em termos tecnológicos, o V4 reduz significativamente os custos ao ampliar a janela de contexto de longo prazo através de uma atualização de arquitetura, apostando claramente nos chips domésticos da Huawei. No mercado, esse lançamento acelera a competição de modelos de IA na China, onde habilidades de programação, taxa de conclusão de tarefas e multimodalidade se tornarão os principais fatores de diferenciação de preços.

O Goldman Sachs mantém sua recomendação para os setores de computação em nuvem e centros de dados, pois a melhoria contínua na eficiência de custos de computação impulsionará a rápida penetração de aplicações de IA, com o crescimento de agentes de IA empresariais e assistentes de IA de consumo, formando uma dupla motriz que sustentará a capacidade de precificação dos serviços em nuvem.

Atualização da arquitetura V4, suportando contextos mais longos com menos memória

DeepSeek V4 foi lançado em duas versões: Pro e Flash.

A versão Pro é de escala de ponta, com 1,6 trilhão de parâmetros (490 milhões de parâmetros ativados); a versão Flash é mais leve, com 284 bilhões de parâmetros (130 milhões de parâmetros ativados). Ambas suportam janelas de contexto de até 1 milhão de tokens, equiparando-se aos principais modelos dos EUA (SOTA), mas com uso de memória e cache KV significativamente reduzidos.

De acordo com o relatório do Goldman Sachs, o V4 Pro, em cenários de 1 milhão de tokens de contexto, requer apenas 27% das operações de ponto flutuante (FLOPs) do DeepSeek V3.2 para inferência de tokens, e o cache KV ocupa apenas 10%; o V4 Flash é ainda mais agressivo, com FLOPs reduzidos a 10% e cache KV comprimido a 7%.

Esse avanço de eficiência é alcançado por meio de três inovações arquitetônicas principais:

  • No que diz respeito ao mecanismo de atenção híbrido, o V4 introduz uma arquitetura mista de atenção esparsa comprimida (CSA) e atenção altamente comprimida (HCA). A CSA realiza compressão sequencial do cache KV antes do cálculo de atenção esparsa, enquanto a HCA usa compressão mais agressiva, mas mantém atenção densa, colaborando para reduzir drasticamente a memória temporária necessária para entradas longas.

  • No que diz respeito à estabilidade de treinamento, o V4 introduz o mecanismo mHC, que reforça a transmissão de informações em múltiplas camadas da rede;

  • Ao mesmo tempo, utiliza o Muon como otimizador principal de treinamento (com algumas partes usando AdamW), para acomodar arquiteturas de rede mais complexas do que as do V3, melhorando a qualidade de convergência durante o treinamento.

O Goldman Sachs destaca que esses ganhos de eficiência são particularmente relevantes para tarefas de longo prazo, como tarefas de agentes de longo ciclo que requerem processamento de grandes volumes de contexto.

Vale notar que, atualmente, o DeepSeek ainda se concentra em modelos de texto básicos, enquanto gigantes da internet como Alibaba, ByteDance, MiniMax e outros preferem rotas multimodais ou de múltiplos modos, havendo uma clara divergência na trajetória de exploração de IA Geral (AGI).

Chips domésticos aceleram implementação, Huawei Ascend 950 abre espaço para redução de custos

Outro sinal importante do lançamento do V4 é que o DeepSeek deixou claro que pretende incluir a produção em massa do supernódo Huawei Ascend 950 em sua estratégia comercial.

O DeepSeek espera que, com a implementação em larga escala do supernódo Huawei Ascend 950 a partir do segundo semestre de 2026, os preços da API do V4 Pro possam diminuir significativamente.

O relatório do Goldman Sachs indica que essa declaração tem duas implicações:

Primeiro, a competitividade de custos do DeepSeek será reforçada, criando condições para uma implementação mais ampla de aplicações; segundo, em um contexto de aperto contínuo de chips, a tendência de migração de modelos de IA de ponta na China para hardware doméstico recebe o respaldo claro dos principais players.

Com base nos preços atuais, o Goldman Sachs mostra que o V4 Pro já possui preços competitivos nas principais plataformas de API, e com a expansão da oferta de capacidade de computação doméstica, essa vantagem deve se ampliar ainda mais na segunda metade de 2026.

A competição por modelos de IA na China entra em fase de diferenciação

O lançamento de código aberto do DeepSeek V4 rapidamente desencadeou uma nova rodada de acompanhamento intenso por parte do ecossistema de IA na China.

Segundo o Goldman Sachs, os principais players que recentemente lançaram novos modelos incluem: Kimi K2.6, Alibaba Qwen3.6-Max, Tencent Hy3 (prévia), Xiaomi V2.5, e o MiniMax M3/Hailuo, previsto para maio.

Na visão do Goldman Sachs, os fatores-chave que determinarão a diferenciação de preços entre os modelos no futuro se concentrarão em dois aspectos:

Taxa de sucesso na programação/conclusão de tarefas, com o modelo GLM da Zhispan liderando em capacidade de código;
Capacidade multimodal, com ByteDance, Alibaba e MiniMax investindo mais profundamente nessa direção.

O relatório aponta que há vantagens e desvantagens claras entre esses dois tipos de players:

Jogadores independentes de IA, como o MiniMax, têm alta eficiência organizacional e cadeias de decisão curtas, podendo alcançar uma margem bruta de 40%, mesmo com preços extremamente baixos para APIs de texto básico, segundo previsões do Goldman Sachs.
Grandes empresas de internet, como ByteDance, Tencent e Alibaba, possuem fluxo de caixa robusto em seus negócios principais, sendo mais adequadas para investir em infraestrutura de IA e no setor de nuvem, com a necessidade de estabelecer equipes de IA independentes e planos de incentivo para reter talentos, como a equipe de Doubao da ByteDance, que já possui incentivos independentes.

Vale destacar que o Goldman Sachs cita notícias de que Tencent e Alibaba estão negociando investimentos na DeepSeek por mais de 20 bilhões de dólares de avaliação, enquanto Zhispan e MiniMax têm avaliações de mercado de aproximadamente 53 bilhões e 31 bilhões de dólares, respectivamente, refletindo uma disputa de gigantes pelo acesso às capacidades de IA de ponta e escassas.

Lógica de prioridade no setor: computação em nuvem e centros de dados

O Goldman Sachs mantém sua avaliação de que a computação em nuvem e os centros de dados continuam sendo os principais subsetores preferidos na China, com a lógica de:

A demanda contínua por tokens de IA impulsionará a aquisição de serviços em nuvem;

O crescimento de clientes empresariais e agentes de IA está melhorando a capacidade de precificação de tokens e serviços em nuvem;

A penetração contínua de assistentes de IA de consumo contribuirá com demanda adicional.

No mercado de nuvem para empresas (To-B), a Alibaba lidera com a maior receita de nuvem de IA externa; no mercado de consumo (To-C), a ByteDance atualmente é a plataforma com maior uso diário de tokens em chatbots de IA, com o uso de tokens em DAU (usuários ativos diários) de aplicações de IA na China mantendo um crescimento forte, com uma taxa de crescimento de 36% em março de 2026 em relação ao mês anterior.

Em relação às ações recomendadas, o Goldman Sachs continua destacando a data de dados globais, Century Internet, Alibaba e Kingsoft Cloud como principais ativos para aproveitar os benefícios do crescimento da infraestrutura de IA na China.

Além disso, a segunda camada inclui empresas de comércio eletrônico e mobilidade; a terceira camada envolve ações relacionadas a modelos de IA; e a quarta camada cobre jogos e entretenimento.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar