Esquecer limites: uma empresa gastou 500 milhões de dólares em um mês no Claude

robot
Geração do resumo em andamento

Autor: Bao Yilong; Fonte: Wall Street Journal

A febre de IA empresarial está enfrentando sua primeira crise de contas de verdade.

Em 28 de maio, segundo a Axios, citando um consultor de IA, um cliente corporativo sob sua gestão gastou recentemente 500 milhões de dólares em um único mês com Claude, devido à ausência de limites de uso para os funcionários.

Análises indicam que muitas empresas, ao expandir rapidamente suas ferramentas de IA, concentram-se nas funcionalidades e na promoção, mas negligenciam a implementação de mecanismos de controle de custos.

Gigantes da tecnologia como Microsoft e Amazon estão tomando medidas, reduzindo ferramentas internas de IA ou interrompendo projetos de monitoramento de uso de IA, para conter o que é chamado de “tokenmaxxing” (maximização de tokens), ou seja, o excessivo consumo de recursos.

Um vice-presidente sênior da Amazon precisou alertar os funcionários:

Por favor, não use IA só por usar.

O problema central que o mercado enfrenta agora não é mais “devo ou não adotar IA”, mas “gastamos tanto dinheiro, o que realmente conseguimos com isso?”.

Amazon fecha rankings internos, “autoavaliações” geram custos reais

O caso da Amazon revela de outro ângulo as dificuldades na governança de IA nas empresas.

Segundo relatos de duas fontes familiarizadas, a plataforma de desenvolvedores da Amazon, Kiro, tinha uma classificação interna chamada "Kirorank", que avaliava os funcionários com base na atividade de uso de IA.

No entanto, essa classificação acabou incentivando os funcionários a elevar suas posições, fazendo com que agentes de IA executassem tarefas sem sentido, o que levou a um aumento no consumo de poder computacional da empresa.

O vice-presidente sênior da Amazon, Dave Treadwell, admitiu nesta semana que, embora a ideia inicial fosse boa, o resultado final foi que os funcionários aumentaram os custos operacionais da companhia por meio do “tokenmaxxing”.

Ele deixou claro que os funcionários não devem focar na quantidade de tokens consumidos, mas sim na criação de produtos melhores, reforçando:

Não use IA só por usar.

A Amazon confirmou posteriormente, em comunicado, que o painel de controle de teste “não era uma ferramenta oficial ou aprovada, e foi desativado”.

A Meta também enfrentou situação semelhante, com funcionários tentando aumentar o consumo de tokens para melhorar sua posição no ranking interno.

Esse fenômeno mostra que, ao incluir o uso de IA na avaliação de desempenho, as empresas podem ter um efeito contrário, distorcendo o incentivo dos funcionários para um consumo inútil de poder computacional.

Depois, a Amazon passou a usar um indicador de “implantação normalizada” em substituição ao consumo de tokens, focando se os engenheiros conseguem gerar continuamente códigos com valor real usando IA.

Vale notar que, neste ano, os gastos de capital da Amazon devem atingir 200 bilhões de dólares, com a maior parte direcionada para IA e infraestrutura de data centers.

Seis principais problemas: por que gastar com IA não gera retorno

Segundo a Axios, a adoção de IA empresarial enfrenta quatro obstáculos estruturais.

Escolha incorreta de casos de uso. Sophia Velastegui, CEO da Velastegui Ventures e ex-chefe de IA da Microsoft, afirma que a maioria das pessoas tende a usar IA para automatizar tarefas que não gostam, ao invés de focar nas atividades mais valiosas para a empresa.

Ela acredita que as empresas devem concentrar recursos de IA em cenários que possam impulsionar receitas diretamente, ao invés de expandir de forma indiscriminada.

Falta de controle de custos. Consultas de IA não são gratuitas; planos corporativos cobram por token, e mesmo consultas simples do dia a dia podem rapidamente acumular despesas consideráveis, das quais a maioria dos departamentos não tem uma compreensão clara.

O maior gargalo são as pessoas. Velastegui classifica a prática comum de “espalhar” autorizações de IA como uma estratégia que não traz retorno substancial.

As empresas fornecem muitas ferramentas de IA aos funcionários, mas sem orientação eficaz ou foco, resultando em baixa adoção real.

Preocupações com o acesso a dados. Josh Pantony, CEO da Boosted.ai, que foca em ferramentas de IA para o setor financeiro, aponta que, quando as empresas hesitam em abrir seus dados internos por questões de segurança, a efetividade dos agentes de IA diminui drasticamente, tornando o retorno sobre o investimento inviável.

Economia de tokens: a nova variável central na narrativa de IA

Por trás dessa discussão, uma lógica de investimento mais complexa está se reestruturando.

Segundo Rich Privorotsky, chefe do departamento One-Delta do Goldman Sachs, o principal fator na negociação de IA mudou de “viabilidade técnica” para “sustentabilidade de custos”.

A DeepSeek reduziu o preço do token em 75%, e a Xiaomi MiMo quase zerou o preço, com uma redução de quase 99%, o que pode desencadear uma “guerra de preços” semelhante à de subsídios.

Ele aponta que as limitações de infraestrutura eventualmente serão resolvidas, e o mercado não deve pagar um prêmio excessivo por problemas que ainda serão solucionados.

Privorotsky também levanta a hipótese de que tokens mais baratos podem substituir rapidamente serviços de inferência de alto custo. Se a demanda por IA crescer com atraso, as receitas de provedores de nuvem, fabricantes de modelos e infraestrutura de IA podem enfrentar pressões de curto prazo.

Ele acredita que a racionalização dos gastos com tokens pode se tornar uma questão importante na governança corporativa no segundo e terceiro trimestres deste ano, tão relevante quanto a narrativa de crescimento de IA.

De acordo com o índice de gastos com tokens da Bloomberg Silicon Data, os preços dos tokens subiram cerca de 65% desde o final de fevereiro, e os preços de softwares de IA nos EUA aumentaram entre 20% e 37% no último ano.

Essa tendência de custos está levando as empresas a reavaliar suas estratégias de aquisição de IA. Quando “obter 90% de resultados com 10% do custo” se torna mais viável, a dependência de modelos de ponta de alto custo pode diminuir de forma sistêmica.

Ali Ansari, CEO da Micro1, uma empresa de treinamento de modelos de IA, afirma que as empresas estão passando por uma “oscilação saudável” de uso excessivo para uso racional de IA. Ele acredita que:

Atualmente, a única área realmente eficiente da IA é a programação.

Disputa de perspectivas: a mesma realidade, duas interpretações

No que diz respeito ao retorno de investimento em IA, dados idênticos podem levar a conclusões completamente diferentes, dependendo da estrutura de análise.

A visão otimista acredita que a confusão atual é apenas uma dor de crescimento normal durante a transformação.

Segundo Jim Schneider, do Goldman Sachs, em uma análise de início de maio, até 2030, a IA baseada em agentes impulsionará o consumo de tokens em 24 vezes, e os grandes provedores de nuvem e modelos terão margens de lucro positivas nos próximos 3 a 12 meses.

A pesquisa econômica do JPMorgan também mostra que, em 2026, o uso de pacotes Python no PyPI terá um crescimento exponencial, algo que não ocorreu na estreia do ChatGPT em 2022, indicando uma verdadeira melhora na produtividade.

Por outro lado, a visão pessimista, apresentada pelo analista de semicondutores Jim Covello, do Goldman Sachs, em relatório de abril, argumenta que quase todo valor na cadeia de IA está indo para as empresas de semicondutores, algo sem precedentes e insustentável na história. As fabricantes de chips deveriam se beneficiar quando os clientes se beneficiam, mas nesta fase, seu crescimento é sustentado pelo consumo na ponta superior da cadeia, às custas de toda a indústria.

Ambas as narrativas coexistirão por algum tempo, e o resultado ainda não está definido. O que se pode afirmar é que a equação “crescimento de consumo de tokens = sucesso na transformação de IA” foi quebrada.

Desde o caso extremo de gastar 500 milhões de dólares em um mês, até a suspensão de rankings internos na Amazon, os investimentos em IA estão passando por uma avaliação mais rigorosa de retorno. Quanto mais a próxima conta de IA gerar valor real, mais essa aposta será realmente testada.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado