A arma DeepSeek já está encostada na nuca do Vale do Silício

DeepSeek V4 lançado poucos dias atrás, a região do Vale do Silício tem fermentado continuamente, trazendo também algumas discussões mais agudas: eficiência do modelo, padrão de chips, momento do IPO, pressão da open source sobre o fechado.

Em 29 de abril, um vlog do Silicon Valley 101 trouxe os arquitetos de chips Xiao Zhibin e a ex-pesquisadora da OpenAI Jenny Xiao, conversando por mais de uma hora, esclarecendo completamente toda a questão.

Ser superado pela open source, seu valor comercial chega a zero

A frase mais dura na conversa foi um conceito já apresentado por Jenny no ano passado — linha de morte (kill line), a linha de morte traçada pelas modelos open source para as empresas de modelos fechados.

"Se você é uma empresa de modelos de base e é superada por open source, o valor do seu negócio é essencialmente zero."

Se você é uma empresa de modelos de base e é superada por open source, seu valor comercial chega a zero.

Isso não é uma competição técnica, é uma linha de vida ou morte.

Jenny deu o exemplo da Anthropic: se um dia Claude deixar de ser o melhor modelo de programação, quem ainda usará Claude Code?

Seguindo essa lógica, em 24 de abril, com o lançamento do DeepSeek V4, todas as ações e avaliações das empresas de modelos fechados no Vale do Silício enfrentam uma pergunta de alma: Seu modelo, ainda vale esse preço?

Falando de preço de forma direta:

GPT-5.5 custa o dobro do GPT-5.4, a versão Pro de textos longos custa 180 dólares por milhão de tokens.

No mesmo dia, foi lançado o DeepSeek V4. Entrada 1 yuan por milhão de tokens, saída 24 yuan por milhão de tokens. A versão Flash é ainda mais agressiva: entrada 0,2 yuan por milhão de tokens, saída 2 yuan por milhão de tokens.

Um custa o dobro, o outro é dez vezes mais barato.

A avaliação das empresas de modelos de base é binária — sua razão de existir é ser o mais forte. Se não for mais o mais forte, o valor cai a zero. Mesmo que seja a OpenAI.

Dinheiro demais, na verdade, não economiza

Jenny revelou uma verdade que o Vale do Silício não quer encarar:

"Empresas do Vale do Silício têm dinheiro demais, e isso acaba desmotivando a otimização de eficiência. Fabricantes de modelos na China, por outro lado, são forçados pelos recursos a inovar mais cedo na eficiência de tokens."

Restrições de recursos, na verdade, aceleram a inovação.

Desde o primeiro dia, a OpenAI acreditou em "move fast, break things" (mova-se rápido, quebre as coisas), comprando GPUs indiscriminadamente, construindo infraestrutura loucamente. A Anthropic, ao contrário, se controla, tem medo de que a receita não acompanhe e que os custos de aquisição a arruínem.

E o resultado? Com a mesma receita, a eficiência de capital da Anthropic é significativamente maior que a da OpenAI.

Mais complicado ainda, a OpenAI atua em várias frentes: hardware, chips próprios, aplicativos de compras, enquanto a experiência principal do ChatGPT não é a melhor. Desde o final do ano passado, várias linhas de projetos secundários foram cortadas, incluindo o Sora.

Os investidores mudaram completamente de mentalidade. Antes, viam as empresas de IA como "uma curva que ainda está em crescimento exponencial, continue investindo". Agora, perguntam:

"Se investir mais 1 bilhão, 10 bilhões, onde está o retorno marginal? Onde está o ROI?"

A resposta direta do DeepSeek é que continuar expandindo a infraestrutura talvez já não seja tão lucrativo.

Inovação é sempre forçada. Barato, por si só, é uma pré-condição para revoluções tecnológicas.

Cada revolução industrial foi impulsionada não só pela tecnologia avançada, mas pelo quão barato ela se tornou. Só quando a tecnologia fica acessível ao comum é que ela realmente muda o mundo.

Sem eficiência, AGI só será um demo

Zhao Zhibin, ao ler o artigo do V4, acha que: "A direção é esperada, mas a completude do engineering é surpreendente."

Todas as otimizações técnicas do V4 na verdade têm um alvo comum — eficiência de tokens (token efficiency).

Ele usou três armas:

• Otimizador Muon: substitui parte do módulo de treinamento tradicional Adam, acelerando a convergência.

Essas três ações juntas apontam para um mesmo resultado: o custo de geração de cada token é menor, e a memória usada por inferência também diminui.

O custo computacional caiu para cerca de um terço do dos modelos do Vale do Silício, e o uso de memória é apenas um décimo.

Mas o que realmente assusta no V4 vai muito além de "economizar dinheiro".

Jenny, na conversa, repetidamente lembra: na era dos chatbots, o consumo de tokens é limitado, e um modelo mais caro ainda assim pode ser tolerado pelos usuários. Mas na era dos agentes, é uma lógica completamente diferente — tarefas longas, decomposição, uso de múltiplas ferramentas, reflexão e planejamento contínuos, o consumo de tokens é de 10 a 100 vezes maior que um chatbot.

Se cada token for caro, o modelo não conseguirá pensar profundamente por longos períodos, nem atender a uma grande escala de usuários.

Por isso, ela afirmou:

Sem eficiência, o AGI só será um demo. Com eficiência, o AGI pode se tornar um produto de verdade.

Na era dos agentes, a eficiência é parte da inteligência.

Por que a Anthropic conseguiu ultrapassar a OpenAI até 1 trilhão? Foco > fazer tudo

Recentemente, a avaliação da Anthropic superou a da OpenAI, atingindo 1 trilhão de dólares.

Jenny listou três razões, mas no fundo, resumiu em cinco palavras: Foco > fazer tudo.

Primeiro, Claude Code.

Por que Claude Code é o "momento definidor" da Anthropic?

O modelo da Anthropic sempre foi bom, mas Claude Code é realmente o produto que impulsiona a receita. Peter Steinberger, fundador do OpenClaw, escreveu um artigo: "Claude Code é o meu computador."

Quando um modelo consegue escrever código, ele pode realizar tarefas gerais — atualizar CRM, encaminhar e-mails, automatizar processos, tudo baseado em código.

Jenny foi precisa: programação é o passo mais importante rumo à AGI. Quem dominar a programação, pode liderar na era da AGI.

Segundo, confiança empresarial.

Clientes corporativos na carteira da Jenny repetem a mesma frase: escolhem a Anthropic porque ela oferece compromisso de segurança. Além disso, a ação da Anthropic ao processar o Pentágono reforçou essa confiança.

Terceiro, foco.

A OpenAI tentou fazer "tudo para todos", mas acabou dispersando suas linhas de atuação e perdendo a liderança técnica. A Anthropic foca em três áreas: segurança, empresas e programação.

Investidores do Vale do Silício acreditam numa lógica: receita de empresas vem primeiro que receita de consumo. A receita da Anthropic é altamente concentrada em negócios corporativos, o que é exatamente a história que o mercado de capitais dos EUA adora.

Nvidia: segurança de curto prazo, mercado de raciocínio a longo prazo inevitavelmente se dividir

Falando de chips, atualmente todos acham que o DeepSeek está "desnvidiaizando".

Mas a situação real é mais detalhada.

Fase de treinamento: o enorme volume de pré-treinamento do V4 certamente foi feito em clusters gigantes da Nvidia. Na página 16 do relatório técnico do V4, e na página 20, mencionam o TCGenO5, além do MegaMoE², que são otimizações profundamente integradas ao ecossistema CUDA.

Fase de adaptação: Huawei Ascend promove "adaptação contínua de treinamento/inferência em 0 dia", AMD fala de "integração e otimização no ROCm".

Perceba uma palavra-chave — "adaptação".

Isso significa que o modelo já foi treinado e ajustado em clusters Nvidia. Ascend e AMD fazem o que? Usam suas próprias stacks de software para "conectar" esse modelo treinado. É uma compatibilidade retroativa, não uma substituição nativa.

Sob esse ponto de vista, no curto prazo, a barreira de entrada da Nvidia na fase de treinamento é mais profunda do que muitos pensam. O ecossistema CUDA não será facilmente substituído em um ou dois anos.

Mas e a longo prazo? O mercado de inferência realmente está se abrindo.

Depois que o V4 reduziu o custo de atenção em contextos longos, a barreira para inferência em larga escala caiu drasticamente. Inferência não é mais "quem tem mais GPU ganha", mas "quem tem arquitetura mais compatível ganha". Google TPU, AMD, chips próprios de nuvem, até o poder de computação nacional, estão buscando oportunidades nessa direção.

O sinal "80/20" que faz o Vale do Silício não dormir

Jenny tem um dado na sua carteira: 80% das tarefas rodam em modelos open source de médio a pequeno porte. Apenas 20% das tarefas mais complexas usam modelos fechados.

Um ano atrás, ninguém acreditaria nesse percentual.

Hoje, no Vale do Silício, todo dia aparece uma notícia assim: "Temos 10 milhões de dólares em ações da OpenAI, vocês estão comprando? Ou conhecem alguém que compra?"

No episódio final do Silicon Valley 101 em 29 de abril, Jenny resumiu tudo com uma frase:

"DeepSeek é como uma arma apontada às costas das empresas de modelos do Vale. Se essas empresas não correrem rápido o suficiente, a DeepSeek vai alcançá-las e destruir seus negócios completamente."

Essa arma já está carregada.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado