Meta vende poder computacional, Palantir reclama, Zhipu se torna o topo do Vale do Silício, a história do Capex de IA precisa ser contada de outra forma.

Escrito por: Beatz dos Ganhos

O mercado de IA sofreu mais uma correção violenta, desta vez porque a Meta disse que pode vender o excesso de poder computacional de IA que possui.

Se essa notícia tivesse sido divulgada há três anos, provavelmente ninguém acharia estranho. Computação em nuvem sempre foi um negócio de fatiar servidores e vendê-los para terceiros. Amazon, Microsoft e Google fazem isso há anos. Novas empresas de nuvem como CoreWeave e Nebius também seguiram esse caminho, transformando chips da NVIDIA em garantias de financiamento, e o financiamento em mais chips.

Mas quando chega a vez da Meta, as coisas mudam de sabor.

No passado, a Meta não entendia poder computacional assim. Ela comprava chips, construía data centers, disputava energia elétrica e terrenos para seus próprios modelos, para o sistema de anúncios, para o feed de recomendações, para a superinteligência cada vez mais próxima que Zuckerberg menciona. Ela não era uma empresa de nuvem. Originalmente, não ganhava dinheiro alugando máquinas para outros.

Uma empresa que antes dizia: "Preciso do máximo de máquinas possível, porque o futuro as consumirá." Agora diz: "Se essas máquinas não forem totalmente utilizadas por enquanto, posso vendê-las para outros."

Isso não prova diretamente excesso de capacidade computacional, mas também não pode ser ignorado.

No dia do crash do mercado de ações, o CEO da Palantir, Alex Karp, em uma entrevista na CNBC, xingou por quase vinte minutos diante das câmeras.

Ele foi originalmente falar sobre a nova parceria entre a Palantir e a NVIDIA, mas rapidamente desviou o assunto para o modelo de cobrança por token da OpenAI e da Anthropic. Ele disse que CEOs reclamam em particular que a adoção corporativa de IA é "pagar por tokens que não criam valor nenhum e ainda ter que entregar seus dados". Ele chegou a chamar as contas cada vez mais caras dos modelos de um imposto sobre a riqueza das empresas.

Nos últimos dois anos, a discussão era sobre quem ousava gastar mais, quem gastava mais rápido, quem conseguia empilhar data centers primeiro. Agora a pergunta está mudando lentamente. Depois que as máquinas são compradas, quem consegue mantê-las funcionando a plena capacidade o tempo todo.

A declaração da Meta ainda não se concretizou como um negócio formal. Em relatórios públicos, há uma direção interna chamada Meta Compute, que pode vender poder computacional bruto, ou, como o Amazon Bedrock, colocar diferentes modelos em sua infraestrutura e vendê-los para desenvolvedores. Zuckerberg já disse em reunião de acionistas que empresas externas perguntam quase toda semana se podem comprar serviços de API ou parte do compute, e estão dispostas a pagar acima do custo da Meta.

Na época, ele também acrescentou uma frase. Eles ainda não fizeram isso porque a Meta acha que ainda precisa desse poder computacional.

Se for necessário, alugar é uma opção. Se não for necessário, alugar é um analgésico para o balanço patrimonial.

A parte mais difícil de julgar é exatamente esta. A Meta pode estar apenas abrindo uma janela em seu ritmo de construção, vendendo recursos temporariamente ociosos. Também pode estar dizendo aos investidores que gastos de IA da ordem de centenas de bilhões de dólares não podem ser sustentados apenas por uma superinteligência distante; é preciso primeiro encontrar uma linha de receita mais próxima.

Ambas as afirmações podem ser verdadeiras.

A demanda não desapareceu, apenas começou a selecionar

Capex é o núcleo da narrativa de IA, sem exceção. Assim como a liquidez de 2021, a expectativa de Capex é crescer sempre, a liquidez continuar fluindo, e todos os ramos do mercado subirem juntos. Ao ver que a Meta está pronta para vender poder computacional, muitos pensam: "O Capex de IA vai desmoronar. As grandes empresas finalmente admitiram que compraram demais. A festa dos semicondutores acabou."

Dizer isso é muito simplista.

Os dados públicos ainda não suportam uma conclusão tão direta. A receita da AWS no primeiro trimestre cresceu 28%, chegando a US$ 37,6 bilhões, um crescimento raro nos últimos anos. O Google Cloud cresceu ainda mais no primeiro trimestre, chegando a US$ 20 bilhões. O Microsoft Azure também continua correndo a cerca de 40%.

A Amazon ainda diz que seus gastos de capital este ano podem chegar a US$ 200 bilhões. A Alphabet elevou sua orientação de Capex para 2026 para US$ 180-190 bilhões. A própria Meta elevou seu Capex anual para US$ 125-145 bilhões.

Esses números não parecem um colapso da demanda.

Parecem mais uma divisão.

A situação das empresas de nuvem é diferente da das empresas de modelos. As empresas de nuvem vendem estradas. Enquanto houver gente correndo na estrada, não importa quem fez o carro, elas ganham dinheiro. OpenAI, Anthropic, clientes corporativos, clientes governamentais, startups – todos acabam caindo em algum data center, algum chip, alguma rede e algum contrato de energia.

Portanto, as três grandes nuvens podem continuar firmes.

A AWS até aumentou o preço de um serviço de nuvem de IA no final de junho. É um serviço que dá aos clientes a chance de reservar GPUs com antecedência. A AWS aumentou o preço desse serviço em cerca de 20% a partir de julho. Já havia aumentado cerca de 15% em janeiro. Essa não é uma ação que ocorre quando a demanda está fraca.

Quando há escassez, o vendedor aumenta o preço.

Mas nem todas as empresas de modelos podem se sentir tão confortáveis.

Os ativos das empresas de modelos são mais exigentes. Poder computacional não gera receita apenas por estar lá. Ele precisa ser preenchido constantemente por modelos mais inteligentes, usuários mais frequentes, fluxos de trabalho corporativos mais caros. Somente quando o modelo é bom o suficiente, os usuários estão dispostos a tolerar filas, limites, aumentos de preço e níveis de assinatura cada vez mais complexos.

É por isso que a Anthropic é vista pelo mercado como um tipo diferente de empresa. Não porque é barata, mas porque os usuários estão dispostos a confiar tarefas caras a ela. Escrever código, modificar sistemas, executar tarefas longas, integrar fluxos de trabalho corporativos – uma vez que essas tarefas entram em ambiente de produção, os tokens consumidos são muito maiores do que em conversas casuais.

O problema de um modelo forte é que não há máquinas suficientes.

O problema de um modelo fraco é que ninguém se importa com as máquinas.

Esses dois problemas são chamados de poder computacional, mas não são a mesma coisa.

A linha da xAI também tem o mesmo cheiro. O Grok não formou uma mentalidade empresarial clara como os modelos mais fortes, mas parte do poder computacional no ecossistema de Musk pode fluir para a Anthropic. Esse movimento é mais frio do que qualquer slogan. As máquinas não reconhecem o fundador; elas reconhecem quem consegue mantê-las a plena capacidade.

A relação entre Google e Meta também mostra que as coisas não são tão simples. Em junho, houve notícias de que o Google restringiu o uso do Gemini pela Meta, porque a Meta queria comprar mais poder computacional do que o Google poderia oferecer, o que até afetou alguns projetos de IA internos da Meta. Uma empresa que considera vender poder computacional, enquanto em algumas tarefas não consegue comprar capacidade suficiente de modelos de ponta.

Isso não é excesso no sentido tradicional.

Isso é desalinhamento. Porque as contas estão começando a ficar gritantes.

As empresas de nuvem podem continuar aumentando os preços, porque vendem certeza. O cliente quer GPUs que estarão disponíveis por um período determinado, um data center estável, uma infraestrutura que não cai no meio da noite.

Mas depois que o cliente corporativo obtém o poder computacional, o problema não acaba.

Eles ainda precisam entregar essa conta ao CFO. O CFO não pergunta quantos tokens você usou; ele pergunta quanto esses tokens economizaram para a empresa, quanto lucro extra geraram, quantos erros evitaram.

Nas empresas, o token se torna um medidor de eletricidade

Isso nos leva de volta à entrevista de Karp no início.

Ele chamou muitas coisas que as empresas de IA vendem para corporações de super-vendas. No dia anterior ao programa, a Palantir publicou uma declaração de nove pontos no X sobre a chamada soberania de IA, na qual destacou especificamente o modelo "tokenmaxxing". Essa palavra é difícil de traduzir, soa mal em tradução direta, mas o significado não é complicado: tratar o consumo de tokens como progresso, queimar dinheiro como uso, e a conta como produtividade.

Karp colocou laboratórios de fronteira como OpenAI e Anthropic na mesa. Ele não quis dizer que as empresas não deveriam usar os modelos mais fortes, mas sim que as empresas não deveriam entregar seus dados, processos e julgamentos de negócios, e depois pagar uma conta cada vez maior com base no consumo.

A Palantir quer vender outra coisa. Não é uma caixa de bate-papo genérica, não é uma única API, mas sim colocar dados, aprovações, permissões, regras operacionais e IA no mesmo sistema de negócios. O que o cliente paga não é "quantas vezes usou IA", mas sim se uma linha de produção, um processo de gerenciamento de risco, ou uma tarefa governamental foi realmente transformada.

As pessoas que realmente controlam o dinheiro nas empresas já estão acordando.

O UBS conversou recentemente com executivos de TI corporativos e uma direção ficou clara. Muitas empresas não estão parando de usar IA, mas estão colocando freios nos gastos com IA. Cerca de 60% das empresas pesquisadas estão reduzindo gastos com tokens, adicionando barreiras de uso, especialmente aquelas que já passaram do período de teste e começaram a colocar IA em processos diários.

Essa também é uma reviravolta interessante.

Depois que a IA passa de brinquedo a ferramenta, gastar dinheiro se torna mais difícil. Na fase de brinquedo, o chefe está disposto a dar orçamento, porque todos têm medo de ficar de fora. Na fase de ferramenta, o CFO pergunta para quem ela economizou horas de trabalho, para quem vendeu mais mercadorias, para quem reduziu riscos.

Nessa tabela, o token não se parece com receita.

Parece mais com um medidor de eletricidade.

Você pode dizer que o medidor girando rápido significa que a fábrica está operando. Também pode dizer que o medidor gira rápido demais e a produção não aumenta, o que indica um problema na máquina.

Os agentes de IA amplificam esse problema. Um estudo da Codex da OpenAI e de algumas universidades trouxe dados assustadores. No primeiro semestre de 2026, os usuários ativos da Codex cresceram mais de cinco vezes; os tokens de saída de alguns cargos internos da OpenAI também explodiram, com o token mensal mediano de saída para cargos jurídicos 13 vezes maior do que em novembro de 2025, e para cargos de pesquisa mais de 50 vezes maior.

Outro estudo torna as coisas mais concretas. Tarefas de codificação agêntica podem consumir até 1000 vezes mais tokens do que bate-papo de código comum e raciocínio de código. Para a mesma tarefa, o consumo de tokens entre diferentes execuções pode variar em 30 vezes.

Essa é a base da escassez de poder computacional hoje.

Não é que as pessoas perguntaram mais algumas coisas a chatbots.

É que o software começou a se tornar um grupo de pequenos trabalhadores que leem arquivos repetidamente, executam comandos, modificam código, falham, recomeçam, falham novamente e recomeçam novamente. Eles não têm hora de almoço, mas cada passo come tokens.

Quando o token se torna um medidor de eletricidade, quem possui a usina elétrica tem poder. Mas quem desperdiça a eletricidade será interrogado primeiro.

Quando a conta fica mais grossa, modelos baratos ganham espaço

Assim que o CFO começa a olhar para esse medidor, o próximo passo quase não precisa ser ensinado.

Ele pergunta: quais tarefas exigem o modelo mais forte, e quais tarefas precisam apenas de um modelo suficiente.

Nesse momento, modelos open-source como GLM, Kimi, DeepSeek, Qwen deixam de ser apenas notícias de tecnologia. Eles se tornam ferramentas de negociação na mesa de compras corporativas.

Até mesmo Marc Andreessen, da a16z, um dos principais VCs do Vale do Silício, disse que muitos profissionais de IA já veem o GLM-5.2 da Zhipu como o primeiro modelo chinês capaz de igualar ou até superar os principais modelos abertos americanos na maioria das tarefas. Esse julgamento pode não ser o veredito final, mas dá às empresas mais uma opção.

A Coinbase deu um exemplo mais concreto. Brian Armstrong disse que a empresa mudou seu modelo de IA padrão para modelos open-source como GLM 5.2 e Kimi 2.7, combinados com roteamento de modelos, cache e contexto enxuto. O uso de tokens ainda cresce exponencialmente, mas os gastos com IA foram reduzidos quase pela metade.

A força dessa afirmação está no fato de que, pela primeira vez, as empresas podem comprar a capacidade do modelo separadamente.

As tarefas mais difíceis continuam sendo entregues ao modelo mais caro. Resumos comuns, atendimento ao cliente, extração de informações, código modelizado, perguntas e respostas de bases de conhecimento internas – tudo isso pode ser entregue a modelos baratos e implantados localmente.

Modelos open-source não precisam vencer todas as batalhas.

Eles só precisam fazer o departamento de compras acreditar que nem todo kilowatt precisa ser pago com tarifa de mansão.

Nesse ponto, a venda de poder computacional da Meta deixa de ser uma notícia isolada.

Ela conta a mesma história que a Palantir xingando tokens e a Coinbase adotando modelos open-source: a cadeia de gastos com IA está começando a se desmembrar. A montante vende certeza, o meio vende resultados, a jusante aperta o preço unitário. Cada camada ainda está crescendo, mas cada camada começa a ser questionada: o dinheiro está sendo bem gasto?

O mais difícil não é comprar máquinas, é manter as máquinas trabalhando o tempo todo

Nos últimos dois anos, a história mais fácil de contar no setor de IA foi a falta de recursos.

GPU insuficiente, eletricidade insuficiente, data centers insuficientes, engenheiros insuficientes, nuvens capazes de rodar modelos insuficientes. Essa história foi muito fluida. Se algo é escasso, todos instintivamente correm para frente. Primeiro, ocupar posições, assinar contratos de energia, comprar chips, levantar máquinas.

Quando se está disputando recursos, as pessoas não calculam minuciosamente.

Porque o custo de ficar para trás parece maior.

Mas a notícia da Meta empurra outro problema para a frente. Depois que as máquinas são compradas, não é porque são caras que automaticamente se tornam um bom negócio. Elas precisam ter trabalho todos os dias, clientes dispostos a pagar, modelos que as utilizem ao máximo, aplicações que convertam custo em receita.

Isso é a taxa de utilização.

A palavra "taxa de utilização" soa fria, mas na verdade é cruel. Ela não pergunta se você tem futuro; ela pergunta se sua máquina está funcionando hoje. Ela não se importa com o que você diz em coletivas de imprensa, nem se você comprou a GPU mais cara. Ela só olha uma coisa: esse dinheiro está se transformando em fluxo de caixa contínuo?

As empresas de nuvem respondem a essa pergunta com relativa facilidade. Elas sempre venderam infraestrutura. AWS, Google Cloud, Azure vendem estradas, eletricidade e salas de servidores. Clientes que precisam treinar modelos, rodar inferência, hospedar aplicações – no final, todos precisam cair em alguma nuvem.

Portanto, elas ainda podem ser duras.

As empresas de modelos fortes também têm sua resposta. Se o modelo é suficientemente forte, os usuários estão dispostos a esperar na fila, as empresas estão dispostas a integrar, os desenvolvedores estão dispostos a modificar fluxos de trabalho em torno dele. Então, poder computacional não é estoque, é gargalo. Quanto mais máquinas, mais espaço para rodar.

O mais difícil é a camada do meio.

Elas têm máquinas, história, equipes de modelo e grandes orçamentos. Mas o modelo não chegou à frente, o produto não se tornou um hábito diário, e os desenvolvedores não estão dispostos a modificar fluxos de trabalho para ele. Para empresas desse tipo, o poder computacional passa de arma a estoque com apenas uma falha no lançamento do modelo, ou uma migração de usuários.

Estoque não é necessariamente inútil.

Mas estoque precisa ter preço reduzido, precisa ser alugado, precisa encontrar novos usos.

É aí que a venda de poder computacional da Meta foca. Não prova que a Meta falhou, nem que a demanda por IA desapareceu. Apenas faz o mercado ver pela primeira vez que a infraestrutura de IA também pode enfrentar os mesmos problemas de uma fábrica comum.

A fábrica foi construída. Onde estão os pedidos?

O poder computacional não desapareceu, apenas começou a estratificar

Portanto, a melhor maneira de entender isso não é "excesso de poder computacional".

Essa palavra é muito grosseira.

Uma descrição mais precisa é que o poder computacional começou a estratificar.

A camada mais alta ainda é apertada. Os modelos mais fortes, a melhor nuvem, os clusters de GPU mais estáveis – ainda há disputa. O serviço da AWS pode aumentar o preço porque a certeza tem preço. O cliente não compra apenas GPU; compra a certeza de que em um determinado dia, a uma determinada hora, um determinado lote de máquinas estará disponível.

A camada do meio começa a ficar estranha. Pode não ser ruim, mas não é escassa. Pode rodar modelos, fazer inferência e vender para clientes externos. Mas os clientes comparam, barganham, perguntam por que não usar um modelo mais barato, por que não usar a nuvem de outra pessoa, por que esse lote de máquinas vale esse preço.

A camada mais baixa será gradualmente comprimida por modelos open-source e otimização de custos. As empresas não vão chamar o modelo mais caro para tarefas comuns para sempre. Elas farão roteamento, cache, apertarão contexto, dividirão modelos em diferentes faixas.

A demanda cresceu.

Crianças pequenas não olham a conta; adultos olham. Quando a IA entra nas empresas, também passa por esse processo. Na fase piloto, todos têm medo de perder; na fase de escala, todos começam a fazer contas.

Depois de fazer contas, a cadeia industrial não será mais tão homogênea como no início.

Alguns continuam aumentando o preço, porque vendem certeza insubstituível. Outros mudam para vender resultados, porque o cliente não quer pagar apenas pelo consumo. Alguns são forçados a reduzir o preço, porque alternativas suficientes surgiram. Alguns alugam suas máquinas, porque deixá-las ociosas é pior do que alugar barato.

Essas coisas acontecendo ao mesmo tempo fazem o setor parecer contraditório.

De um lado, escassez de poder computacional.

De outro, aluguel de poder computacional.

De um lado, consumo de tokens explode.

De outro, empresas reduzem gastos com IA.

De um lado, modelos de ponta ficam cada vez mais fortes.

De outro, modelos open-source ficam cada vez mais baratos.

Eles não são conflitantes. Apenas indicam que a IA passou de uma história de volume total para uma história de estrutura.

A história das ferrovias antigas será contada novamente

Na bolha ferroviária do século XIX, as ferrovias não eram falsas.

Os trilhos foram colocados, as mercadorias realmente se moviam, as cidades realmente cresciam, o tempo realmente era encurtado. Muitas das redes comerciais mais valiosas posteriormente cresceram ao lado desses trilhos.

Mas isso não impediu que muitas pessoas que construíram ferrovias na época perdessem dinheiro.

Eles não perderam na direção. Eles perderam porque construíram cedo demais, construíram demais, construíram em lugares onde não havia passageiros ou cargas, ou pediram dinheiro emprestado muito caro para construir uma estrada que levaria muito tempo para se pagar.

A fibra óptica na bolha da internet também foi a mesma coisa. A fibra óptica não estava errada. Mais tarde, o mundo inteiro foi sustentado por ela. O erro foi naqueles livros contábeis, que colocaram a demanda de décadas futuras em gastos de capital de poucos anos.

Os data centers de IA também podem deixar muitas coisas úteis. GPUs vão se depreciar, contratos de energia serão renovados, data centers vão trocar equipamentos, software vai consumir cada vez mais poder computacional. O consumo de tokens que parece exagerado hoje pode se tornar tão comum quanto o tráfego de vídeo em alta definição em alguns anos.

Mas os ativos têm seu próprio temperamento.

Eles não se importam se você acredita no futuro. Eles só se importam se alguém vem usá-los todos os dias.

O sinal da Meta vendendo poder computacional está preso exatamente nesse ponto.

Não é o fim da IA. Nem o fim dos semicondutores. É mais como, quando a narrativa dos gastos de capital chega ao meio do caminho, alguém abre a porta pela primeira vez para que as pessoas de fora vejam quantas máquinas estão no armazém.

Algumas máquinas serão consumidas pelos principais modelos.

Algumas máquinas serão alugadas por clientes de nuvem.

Algumas máquinas ficarão mais baratas na guerra de preços.

E algumas máquinas esperarão silenciosamente por uma aplicação que ainda não apareceu.

Nos últimos dois anos, o mercado estava disposto a acreditar que todas as máquinas eventualmente encontrariam seu destino. Agora começa a perguntar: quem encontrará primeiro, quem não encontrará, quem encontrará mas não ganhará dinheiro suficiente.

Quando essa pergunta surge, a história da IA muda.

Ela não pertence mais apenas àqueles que compram máquinas mais rápido.

Ela pertence àqueles que conseguem manter as máquinas girando para sempre.

Link original

Clique para saber sobre as vagas em aberto na BlockBeats

Bem-vindo a se juntar à comunidade oficial da BlockBeats:

Grupo de assinatura do Telegram: https://t.me/theblockbeats

Grupo de conversa do Telegram: https://t.me/BlockBeats_App

Conta oficial do Twitter: https://twitter.com/BlockBeatsAsia

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado