No primeiro semestre deste ano, o "Tokenmaxxing" tornou-se uma palavra da moda no círculo empresarial de IA. Empresas como a Meta e a Salesforce incentivaram ativamente os funcionários a consumir o máximo possível de tokens de IA para aumentar a produtividade. Internamente, a Meta chegou a ter um ranking chamado "Claudeconomics", que monitorizava os 250 maiores utilizadores da empresa. Os dados mostram que os funcionários da Meta consumiram mais de 60 biliões de tokens em 30 dias, com o maior consumidor individual a atingir cerca de 280 mil milhões de tokens. Para competir por títulos como "Lenda dos Tokens" ou "Mestre da Cache", os funcionários faziam com que os agentes de IA passassem horas em pesquisas inúteis para "queimar tokens".

Depois, a Uber tornou-se notícia por queimar o orçamento anual do Claude Code e do Codex em quatro meses, impondo de seguida um limite mensal de 1500 dólares por funcionário, sendo que valores superiores requeriam aprovação caso a caso.

Estes eventos atraíram grande atenção. Contudo, após realizar uma pesquisa de campo na Cimeira de IA da Databricks e conversar em profundidade com mais de 50 clientes empresariais via Slack e telefone, a equipa da SemiAnalysis chegou a uma conclusão bem diferente da narrativa mediática.

A instituição acredita que os relatos dos media exageraram gravemente a prevalência do problema. Os casos extremos da Meta e da Uber têm origem em incentivos inadequados e na falta de controlo interno, e não num descontrolo geral dos investimentos empresariais em IA.

Histórias de manchetes exageradas, dados reais mais moderados

Os relatos dos media podem estar a exagerar a crise orçamental da IA empresarial.

Os dados-chave sustentam esta avaliação. A SemiAnalysis cita dados de consumo da Ramp que mostram que os 1% principais clientes gastam cerca de 90 mil dólares por funcionário por ano em IA, os 10% principais cerca de 7300 dólares, mas a mediana dos clientes da Ramp é de apenas 136 dólares. O nível geral de adoção tecnológica dos clientes da Ramp já é muito superior ao das empresas comuns, mas a despesa média per capita em IA dos clientes do setor dos media da Fortune 500 continua a ser muito inferior a 100 dólares.

Mesmo a Meta, um "grande consumidor de tokens", com um gasto anual por funcionário de cerca de 50 mil dólares a preços de tabela, representa, segundo a SemiAnalysis, apenas 3% a 5% das receitas de clientes da Anthropic.

A própria documentação da Anthropic confirma este ponto: o gasto médio mensal dos programadores do Claude Code é de apenas 150 a 250 dólares, e apenas 10% dos utilizadores gastam mais de 30 dólares por dia.

A SemiAnalysis considera que: "Os relatos exagerados dos media não são verdadeiros – as empresas continuam a investir, e o consumo de tokens proveniente de novos cenários de procura e setores verticais está a impulsionar o comboio da IA a avançar a um ritmo acelerado."

Isto significa que a adoção da IA empresarial ainda está numa fase de difusão desigual. Nem todos os funcionários estão a utilizar modelos de grande escala com alta frequência. Em muitas empresas, apenas algumas equipas e alguns cargos estão a dar os primeiros passos.

Controlo orçamental torna-se a nova norma, mas os padrões são variados

Dentre as mais de 50 empresas inquiridas, a maioria já definiu limites rigorosos para o uso de IA. No entanto, os padrões variam enormemente entre empresas, não havendo um consenso no setor.

Casos de baixo limite:

Um dos três maiores fabricantes aeroespaciais e de defesa dos EUA: limite de 250 dólares por pessoa por mês, com alguns utilizadores intensivos a esgotarem o orçamento nos primeiros quatro dias do mês.
Uma das maiores farmacêuticas do mundo: 500 dólares por pessoa por mês, podendo ser solicitados 1000 dólares em casos especiais.

Casos de alto limite:

Workday, Stripe: orçamento mensal de cerca de 2000 dólares por funcionário.
Empresa de cibersegurança cotada em bolsa: funcionários juniores recebem 800 dólares por mês, seniores 1600 a 4000 dólares, com os cientistas de dados a obterem o valor mais alto.
Grande empresa tecnológica de viagens (800 engenheiros num total de 1500 funcionários, com gastos anuais em IA próximos dos 10 milhões de dólares): valor predefinido de 200 dólares por pessoa por mês, podendo aumentar para dezenas de milhares consoante o cargo.

A lógica de definição orçamental também varia. A abordagem mais peculiar é a de uma das três maiores companhias aéreas dos EUA, onde a alocação de tokens está diretamente ligada a projetos específicos e às receitas esperadas. Por exemplo, para um projeto com receita esperada de 10 milhões de dólares, a equipa financeira aprova um orçamento total de 1 milhão de dólares, e a equipa decide que percentagem desse valor será gasta em tokens – os custos de IA são integrados no modelo financeiro do projeto, e não num orçamento IT separado.

A "lei da sobrevivência" dos funcionários para poupar tokens

A pressão orçamental levou ao desenvolvimento de estratégias práticas para poupar tokens.

O exemplo mais típico é a "arbitragem do Copilot": os subscritores empresariais do Microsoft 365 podem usar ilimitadamente e gratuitamente o chatbot Copilot padrão, e esse uso não conta para o orçamento mensal de IA. Uma grande empresa holandesa de produtos de consumo e tecnologia de saúde afirmou claramente que os funcionários usam primeiro o Copilot para rascunhar e consolidar ideias, e só depois chamam o Claude ou o Codex para tarefas finais, poupando assim tokens medidos.

A redução do modelo também é um meio comum. A empresa global de tecnologia de viagens já mudou o modelo predefinido do Claude para todos os funcionários de Opus para Sonnet, mantendo o Opus disponível, mas exigindo seleção ativa. O fabricante aeroespacial e de defesa desativou diretamente o Opus 4.8 e o modo rápido.

A este respeito, a equipa da SemiAnalysis comentou diretamente a lógica da gestão: "A administração acredita que dar orçamentos de tokens maiores aos funcionários os leva a automatizar tarefas que nem sequer deviam ser automatizadas, como escrever e-mails. Consideramos esta visão anti-automação demasiado ingénua."

A procura por tokens baratos continua a crescer, o mercado de TaaS/API endpoints não arrefeceu

Gerir o orçamento não significa reduzir as chamadas. As empresas preocupam-se mais com o custo unitário.

A procura por tokens baratos continua forte. Tanto os mercados de Token-as-a-Service/API endpoints para modelos de ponta como para modelos open source estão a crescer. Depois de incluir o AWS Bedrock nos cálculos, a estimativa da SemiAnalysis para a taxa de crescimento global da AWS neste trimestre é superior às expectativas do mercado.

Os fornecedores de TaaS também estão a expandir-se. Empresas como Together, Fireworks e Baseten têm um ARR combinado superior a 4 mil milhões de dólares.

Isto mostra que a pressão orçamental empresarial vai alterar a estrutura de aquisição. Problemas que podem ser resolvidos com modelos baratos não vão estar sempre a chamar os modelos mais caros. A redução do modelo predefinido não significa uma diminuição do uso de IA, mas sim uma reotimização da curva de custos.

Programação continua a ser a maior necessidade, o comboio da IA não abrandou por causa dos limites orçamentais

A programação continua a ser o maior motor das receitas de IA atualmente, com mais de 70% do ARR da OpenAI e da Anthropic a vir desta área. A Anthropic tem uma percentagem B2B superior a 90% (cerca de 60% na OpenAI), o que torna a sua estrutura de receitas mais dependente e mais estável face ao setor empresarial.

A próxima vaga de crescimento é considerada vir da cibersegurança e do trabalho do conhecimento de "colarinho branco". À medida que produtos como Cowork, CoPilot, Codex e Computer penetram ainda mais nas empresas, o caminho de crescimento do ARR dos laboratórios de IA, puxado pelo mercado de programação, vai repetir-se em cenários mais amplos.

Atualmente, a despesa média per capita em IA da maioria das empresas da Fortune 500 continua muito abaixo dos 2000 dólares/ano, concentrada principalmente nos departamentos de engenharia e ciência de dados. Isto significa que a adoção de IA nas empresas ainda está numa fase inicial, e o espaço de crescimento não desapareceu, apenas mudou de forma – de "queimar dinheiro à vontade" para "investir continuamente com orçamento".

O verdadeiro ROI da IA: ganhos de eficiência, mas as expectativas de produção também aumentam

Nas empresas inquiridas, os casos de ganhos de eficiência proporcionados pela IA são reais e com efeitos significativos.

Departamento de recrutamento da Amazon: o processo, que antes demorava 6 a 9 meses desde a triagem inicial até à colocação da equipa, reduziu-se para 3 a 4 meses com recurso a ferramentas de IA.
Uma empresa que fornece serviços de análise de dados a 85% das empresas da Fortune 500: o trabalho que antes demorava uma semana, agora faz-se em poucas horas.

No entanto, o outro lado do ganho de eficiência é que as expectativas de produção também aumentam. Uma funcionária de uma empresa de soluções de dados jurídicos e de risco confessou que o trabalho de uma semana foi comprimido para algumas horas, "mas a empresa espera agora que ela faça mais trabalho, resultando em que ela esteja mais ocupada do que antes".

A SemiAnalysis salienta que os incidentes de excesso de tokens na Uber e na Meta tiveram como causa fundamental incentivos inadequados e falta de supervisão, e não a falta de cenários de aplicação com alto ROI. A Amazon, apesar dos despedimentos em massa, está a contratar novos funcionários a um ritmo mais rápido graças aos ganhos de eficiência trazidos pelas ferramentas de IA – esta é a nota mais clara da IA como "alavanca humana".

Aviso de risco e termos de isenção de responsabilidade

        O mercado apresenta riscos, o investimento requer cautela. Este artigo não constitui aconselhamento de investimento pessoal e não considera os objetivos de investimento, situação financeira ou necessidades específicas de cada utilizador. Os utilizadores devem avaliar se quaisquer opiniões, pontos de vista ou conclusões neste artigo se adequam à sua situação específica. O investimento com base neste artigo é da responsabilidade do próprio.

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.

Recompensa
gostar
Comentar
Republicar
Partilhar

Comentar

Adicionar um comentário

Nenhum comentário

Tópicos em destaque
Ver mais
#
GateCompletesDividendDistribution
125,91K Popularidade
#
StrategyBuybackSurges12%
6,97M Popularidade
#
IsraelStrikesIranBTCPlunges
67,14K Popularidade
#
PredictWorldCupShare20000U
523,6K Popularidade
#
TrumpDisclosesOver100MBTCETH
3,83M Popularidade

Fixado

Realidade empresarial após a maré baixa da euforia dos tokens: o controlo orçamental torna-se o novo normal, mas o comboio da IA não abranda.

Histórias de manchetes exageradas, dados reais mais moderados

Controlo orçamental torna-se a nova norma, mas os padrões são variados

A "lei da sobrevivência" dos funcionários para poupar tokens

A procura por tokens baratos continua a crescer, o mercado de TaaS/API endpoints não arrefeceu

Programação continua a ser a maior necessidade, o comboio da IA não abrandou por causa dos limites orçamentais

O verdadeiro ROI da IA: ganhos de eficiência, mas as expectativas de produção também aumentam

Tópicos em destaque

GateCompletesDividendDistribution

StrategyBuybackSurges12%

IsraelStrikesIranBTCPlunges

PredictWorldCupShare20000U

TrumpDisclosesOver100MBTCETH

Fixado