Análise: O fim da era de subsídios de poder de computação de IA, o alto consumo de agentes inteligentes pode forçar a redução de ativos industriais

robot
Geração do resumo em andamento
ME AI Mensagem, de acordo com a monitorização do Beating, a era de subsídios de assinatura de IA de grandes modelos que operam com prejuízo há muito tempo está acelerando seu fim. O analista Hedgie destacou que o custo real cobrado por token já ultrapassou as expectativas das empresas, o que forçará a indústria a enfrentar um dilema: ou as empresas reduzem drasticamente o uso de agentes devido ao estouro do orçamento, ou os fabricantes de modelos reduzem preços e absorvem as perdas, ambas as opções levando eventualmente a uma redução de ativos (Writedown). Recentemente, os eventos de estouro de orçamento de capacidade computacional da Microsoft e da Uber expuseram os pontos críticos de custo dos agentes (Agent). Na Uber, o uso de ferramentas de IA resultou em custos de API de até 500 a 2000 dólares por mês por engenheiro, levando a Uber a esgotar completamente seu orçamento anual de IA nos primeiros quatro meses de 2026. O departamento de Experiências + Dispositivos da Microsoft também anunciou que encerrará a autorização do Claude Code até 30 de junho. Casos semelhantes indicam que, quando as empresas passam de complementos automáticos de frases tradicionais para agentes inteligentes de raciocínio autônomo de múltiplas etapas, o consumo baseado em tokens aumenta exponencialmente, quebrando a hipótese de negócios de taxa fixa (Flat-rate) anterior. Para esse impasse de custos, o futuro da indústria pode seguir duas rotas distintas. A primeira é que, se as empresas reduzirem amplamente o uso de agentes para atender ao orçamento, os desenvolvedores de grandes modelos enfrentarão uma desaceleração no crescimento da receita, dificultando a sustentação de avaliações elevadas antes do IPO. A segunda é que, se os desenvolvedores de modelos reduzirem preços para manter o uso, a própria economia unitária (Unit Economics) desses modelos se deteriorará ainda mais em momentos desfavoráveis. A partir de 1º de junho de 2026, o GitHub Copilot implementará totalmente o modelo de cobrança por uso de créditos de IA, que na essência transfere a pressão de custos computacionais para o usuário final. No final, essa conta malfeita de capacidade computacional terá que ser assumida por uma das partes por meio de uma redução de ativos (Writedown). (Fonte: BlockBeats)
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • 10
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
ByteSizedAlpha
· 5h atrás
A exposição dos pontos fracos de custo é algo positivo, forçando a indústria a retornar à praticidade em vez de apenas exibir habilidades
Ver originalResponder0
PerpMoodSwing
· 8h atrás
O Copilot só mudará a cobrança em 2026, oferecendo um ano de período de adaptação, sendo talvez a última demonstração de gentileza.
Ver originalResponder0
MarginMom
· 14h atrás
Eu já vi aquele caso da Uber, o custo do agente inteligente fez o ROI ficar negativo.
Ver originalResponder0
BearMarketInAPaperCup
· 14h atrás
A mudança no modelo de cobrança do Copilot é bastante agressiva, transferindo diretamente os custos para os usuários, e até a Microsoft não consegue mais suportar.
Ver originalResponder0
GateUser-f2d5f4c0
· 14h atrás
Quanto mais inteligente o agente, mais caro ele é, como resolver essa contradição?
Ver originalResponder0
ColdWalletInTheAutumnBreeze
· 14h atrás
O modelo de cobrança por token em si já apresenta problemas, pois os usuários simplesmente não conseguem prever a fatura mensal.
Ver originalResponder0
SlippageSiren
· 14h atrás
Aplicações de IA de nível empresarial agora precisam recalcular suas contas, a economia de tokens é mais importante do que a capacidade do modelo
Ver originalResponder0
Half-SectionSucculent
· 14h atrás
Essa jogada do GitHub equivale a dizer claramente 'antes tinha subsídio, agora não tem mais', o bolso dos desenvolvedores vai sangrar
Ver originalResponder0
ApyDaydreamer
· 14h atrás
Fabricantes estão atualmente em uma situação difícil: reduzir preços causa prejuízo, não reduzir causa perda de clientes, a depreciação de ativos chegará cedo ou tarde
Ver originalResponder0
SushiRebalance
· 14h atrás
A velocidade de queima de tokens em raciocínios de múltiplas etapas é ainda mais absurda do que eu imaginava, não é brincadeira ser exponencial
Ver originalResponder0
Ver projetos
  • Fixado