No primeiro semestre deste ano, "Tokenmaxxing" se tornou uma palavra da moda no círculo de IA empresarial. Empresas como Meta e Salesforce incentivaram ativamente seus funcionários a consumir o máximo possível de tokens de IA para aumentar a produtividade. Internamente, a Meta até criou um ranking chamado "Claudeconomics" para rastrear os 250 maiores usuários da empresa. Os dados mostram que os funcionários da Meta consumiram mais de 60 trilhões de tokens em 30 dias, com o maior usuário individual consumindo cerca de 280 bilhões de tokens. Para competir por títulos como "Lenda dos Tokens" e "Mago do Cache", os funcionários faziam os agentes de IA realizarem pesquisas sem sentido por horas a fio para "queimar tokens".

Em seguida, a Uber virou manchete por queimar em quatro meses todo o orçamento anual do Claude Code e Codex, e imediatamente impôs um limite de uso mensal de US$ 1.500 por funcionário, com valores excedentes precisando de aprovação caso a caso.

Esses eventos geraram grande atenção. No entanto, a equipe da SemiAnalysis, após realizar pesquisas de campo na Databricks AI Summit e conversar profundamente com mais de 50 clientes empresariais via Slack e telefone, chegou a conclusões bem diferentes das narrativas da mídia.

A instituição acredita que as reportagens da mídia exageraram seriamente a universalidade do problema. Os casos extremos da Meta e da Uber têm raiz em incentivos inadequados e gestão interna frouxa, e não em um descontrole geral dos investimentos em IA empresarial.

Histórias de manchete são exageradas, dados reais são mais moderados

As reportagens da mídia podem ter exagerado a crise orçamentária da IA empresarial.

Dados-chave sustentam esse julgamento. A SemiAnalysis cita dados de consumo da Ramp, mostrando que os 1% principais clientes gastam cerca de US$ 90.000 por funcionário por ano em IA, os 10% principais cerca de US$ 7.300, enquanto a mediana dos clientes da Ramp é de apenas US$ 136. O nível geral de adoção de tecnologia dos clientes da Ramp já é muito superior ao de empresas comuns, mas o gasto médio per capita em IA dos clientes do setor de mídia da Fortune 500 ainda é muito inferior a US$ 100.

Mesmo a Meta, considerada "grande consumidora de tokens", gasta cerca de US$ 50.000 por funcionário por ano a preços de tabela, o que, segundo estimativas da SemiAnalysis, representa apenas 3% a 5% da receita de clientes da Anthropic.

A própria documentação da Anthropic corrobora isso: o gasto médio mensal dos desenvolvedores do Claude Code é de apenas US$ 150 a US$ 250, e apenas 10% dos usuários gastam mais de US$ 30 por dia.

A SemiAnalysis conclui: "As reportagens exageradas da mídia não são verdadeiras — as empresas continuam investindo, e o consumo de tokens impulsionado por novos cenários de demanda e setores verticais está fazendo o trem da IA continuar avançando em ritmo acelerado."

Isso significa que a adoção de IA empresarial ainda está em um estágio de difusão desigual. Nem todos os funcionários estão usando modelos de IA com alta frequência. Em muitas empresas, apenas algumas equipes e alguns cargos estão na vanguarda.

Controle de orçamento se torna novo normal, mas padrões variam amplamente

Das mais de 50 empresas entrevistadas, a maioria já estabeleceu limites rígidos para o uso de IA. Mas os padrões variam enormemente entre as empresas, sem consenso no setor.

Casos de limite baixo:

Uma das três maiores fabricantes aeroespaciais e de defesa dos EUA: limite de US$ 250 por pessoa por mês, com alguns usuários pesados esgotando a cota nos primeiros quatro dias do mês.
Uma das maiores farmacêuticas do mundo: limite de US$ 500 por pessoa por mês, com possibilidade de solicitar US$ 1.000 em casos especiais.

Casos de limite alto:

Workday, Stripe: orçamento mensal por funcionário de cerca de US$ 2.000.
Empresa de segurança cibernética de capital aberto: funcionários juniores têm US$ 800 por mês, seniores US$ 1.600 a US$ 4.000, e cientistas de dados recebem os maiores limites.
Grande empresa de tecnologia de viagens (800 engenheiros entre 1.500 funcionários, gastos anuais com IA próximos a US$ 10 milhões): padrão de US$ 200 por pessoa por mês, podendo aumentar para dezenas de milhares conforme o cargo.

A lógica por trás da definição do orçamento também varia. A abordagem mais peculiar é a de uma das três maiores companhias aéreas dos EUA: a alocação de tokens está diretamente vinculada a projetos específicos e à receita esperada. Por exemplo, para um projeto com receita esperada de US$ 10 milhões, a equipe financeira aprova um orçamento total de despesas de US$ 1 milhão, e a equipe decide por conta própria qual proporção será usada para tokens — o custo de IA é incorporado ao modelo financeiro do projeto, e não a um orçamento separado de TI.

A "lei de sobrevivência" dos funcionários para economizar tokens

A pressão orçamentária gerou um conjunto prático de estratégias de economia de tokens.

A mais típica é a "arbitragem do Copilot": assinantes do Microsoft 365 Enterprise podem usar gratuitamente e sem limites o chatbot Copilot padrão, e esse uso não é contabilizado no orçamento mensal de IA. Uma grande empresa holandesa de produtos de consumo e saúde afirmou explicitamente que seus funcionários primeiro usam o Copilot para rascunhar e integrar ideias, depois recorrem ao Claude ou Codex para tarefas finais, economizando assim tokens medidos.

A redução de modelo também é uma tática comum. A empresa global de tecnologia de viagens já mudou o modelo Claude padrão de todos os funcionários de Opus para Sonnet, sendo que o Opus ainda pode ser usado, mas requer seleção ativa. A fabricante aeroespacial e de defesa simplesmente "desativou" o Opus 4.8 e o modo rápido.

Sobre isso, a equipe da SemiAnalysis comentou diretamente a lógica da gestão: "A administração acredita que dar maiores orçamentos de tokens aos funcionários os levará a automatizar tarefas que nem deveriam ser automatizadas, como escrever e-mails. Consideramos essa visão anti-automação ingênua demais."

Demanda por tokens baratos ainda está crescendo, mercado de TaaS/endpoints de API não esfriou

Gerenciamento de orçamento não significa redução de chamadas. O que as empresas realmente se importam é o custo unitário.

A demanda por tokens baratos ainda é forte. O mercado de Token-as-a-Service/endpoints de API para modelos de ponta e modelos de código aberto está crescendo. Após incluir o AWS Bedrock nas medições, a estimativa da SemiAnalysis para a taxa de crescimento geral da AWS neste trimestre é superior às expectativas do mercado.

Os fornecedores de TaaS também estão em expansão. Empresas como Together, Fireworks e Baseten têm uma receita anualizada combinada de mais de US$ 4 bilhões.

Isso mostra que a pressão orçamentária empresarial alterará a estrutura de compras. Problemas que podem ser resolvidos com modelos baratos não precisam sempre chamar o modelo mais caro. A redução do modelo padrão não significa menos uso de IA, mas uma reotimização da curva de custos.

Codificação continua sendo a maior demanda, o trem da IA não desacelerou por causa dos limites orçamentários

O cenário de codificação ainda é o maior motor da receita atual de IA, com OpenAI e Anthropic gerando mais de 70% de sua ARR a partir dessa direção. A participação B2B da Anthropic é superior a 90% (cerca de 60% para a OpenAI), o que torna sua estrutura de receita mais dependente e mais estável em relação ao lado empresarial.

A próxima onda de crescimento é considerada originada da segurança cibernética e do trabalho do conhecimento de colarinho branco. Com a penetração adicional de produtos como Cowork, CoPilot, Codex e produtos do tipo Computer nas empresas, o caminho de crescimento da ARR dos laboratórios de IA impulsionado pelo mercado de codificação se repetirá em cenários mais amplos.

Atualmente, a maioria das empresas da Fortune 500 gasta menos de US$ 2.000 por funcionário por ano em IA, concentrado principalmente nos departamentos de engenharia e ciência de dados. Isso significa que a disseminação da IA nas empresas ainda está em estágio inicial, e o espaço de crescimento não desapareceu, apenas mudou de forma — de "queimar dinheiro à vontade" para "investimento contínuo com orçamento".

O verdadeiro ROI da IA: ganhos de eficiência, mas expectativas de produção também aumentam simultaneamente

Entre as empresas entrevistadas, os casos de ganhos de eficiência proporcionados pela IA são reais e com efeitos significativos.

Departamento de recrutamento da Amazon: o processo, desde a triagem inicial até a colocação da equipe, levava de 6 a 9 meses; com ferramentas de IA, foi reduzido para 3 a 4 meses.
Uma empresa que fornece serviços de análise de dados para 85% da Fortune 500: tarefas que antes levavam uma semana agora são concluídas em algumas horas.

Mas o outro lado do ganho de eficiência é que as expectativas de produção também aumentam simultaneamente. Uma funcionária de uma empresa de soluções de dados jurídicos e risco admitiu que a carga de trabalho de uma semana foi comprimida para algumas horas, "mas a empresa passou a esperar que ela fizesse mais trabalho, resultando em ela ficar mais ocupada do que antes".

A SemiAnalysis aponta que os eventos de estouro de tokens em empresas como Uber e Meta tiveram como causa raiz incentivos inadequados e supervisão frouxa, e não a falta de cenários de aplicação com alto ROI. A Amazon, apesar das demissões em massa, está contratando novos funcionários mais rapidamente devido aos ganhos de eficiência proporcionados pelas ferramentas de IA — esta é a anotação mais clara da IA como "alavanca de força de trabalho".

Aviso de risco e termos de isenção de responsabilidade

        Mercado tem riscos, investir requer cautela. Este artigo não constitui aconselhamento de investimento pessoal e não considera os objetivos de investimento, situação financeira ou necessidades específicas de usuários individuais. Os usuários devem considerar se quaisquer opiniões, pontos de vista ou conclusões neste artigo são adequados à sua situação particular. Invista por sua própria conta e risco.

Ver original

Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.

Recompensa
curtir
Comentário
Repostar
Compartilhar

Comentário

Adicionar um comentário

Sem comentários

Tendências
Ver projetos
#
GateCompletesDividendDistribution
125,91K Popularidade
#
StrategyBuybackSurges12%
6,97M Popularidade
#
IsraelStrikesIranBTCPlunges
67,14K Popularidade
#
PredictWorldCupShare20000U
523,6K Popularidade
#
TrumpDisclosesOver100MBTCETH
3,83M Popularidade

Fixado

sitemap

Realidade corporativa após o recuo da febre dos tokens: o controle de orçamento se torna o novo normal, mas o trem da IA não desacelerou.

Histórias de manchete são exageradas, dados reais são mais moderados

Controle de orçamento se torna novo normal, mas padrões variam amplamente

A "lei de sobrevivência" dos funcionários para economizar tokens

Demanda por tokens baratos ainda está crescendo, mercado de TaaS/endpoints de API não esfriou

Codificação continua sendo a maior demanda, o trem da IA não desacelerou por causa dos limites orçamentários

O verdadeiro ROI da IA: ganhos de eficiência, mas expectativas de produção também aumentam simultaneamente

Tendências

GateCompletesDividendDistribution

StrategyBuybackSurges12%

IsraelStrikesIranBTCPlunges

PredictWorldCupShare20000U

TrumpDisclosesOver100MBTCETH

Fixado