Esquecer limites: uma empresa gastou 500 milhões de dólares em um mês no Claude

robot
Geração de resumo em curso

Autor: Bao Yilong; Fonte: Wall Street Journal

A febre de IA empresarial está a enfrentar a sua primeira crise de contas de verdadeiro significado.

Em 28 de maio, segundo a Axios, citando um consultor de IA, um cliente empresarial sob sua gestão gastou recentemente 500 milhões de dólares num único mês em Claude, devido simplesmente à ausência de limites de uso para os funcionários.

Análises sugerem que muitas empresas, ao expandirem rapidamente as ferramentas de IA, concentram-se nas funcionalidades e na promoção, mas negligenciam a implementação de mecanismos de controlo de custos.

Gigantes tecnológicos como Microsoft e Amazon estão a tomar medidas, reduzindo ferramentas de IA internas ou suspendendo projetos de monitorização do uso de IA, para conter comportamentos de consumo excessivo chamados de “tokenmaxxing” (maximização de tokens).

Um vice-presidente sénior da Amazon teve que alertar os funcionários:

Por favor, não usem IA só por usar IA.

O problema central que o mercado enfrenta agora já não é “devo ou não adotar IA”, mas sim “gastei tanto dinheiro, o que é que realmente obtive em troca?”.

Amazon fecha rankings internos de “pontuação” que geram custos reais

O caso da Amazon revela de outro ângulo as dificuldades na governação de IA nas empresas.

Segundo relatos de duas fontes conhecidas, a plataforma de desenvolvedores da Amazon, Kiro, tinha um ranking interno chamado “Kirorank”, que avaliava os funcionários com base na sua atividade de uso de IA.

No entanto, esse ranking acabou por desencadear comportamentos em que os funcionários, para subir na classificação, faziam com que agentes de IA realizassem tarefas sem sentido, levando a um aumento no consumo de recursos computacionais da empresa.

O vice-presidente sénior da Amazon, Dave Treadwell, admitiu esta semana aos funcionários que o objetivo do ranking era bom, mas que o resultado final foi que os funcionários, através do “tokenmaxxing”, aumentaram os custos operacionais da empresa.

Ele deixou claro que os funcionários não deviam focar-se na quantidade de tokens consumidos, mas sim em criar produtos melhores, reforçando a ideia de “não usar IA só por usar”.

A Amazon confirmou posteriormente, numa declaração, que o painel de controlo de testes “não era uma ferramenta oficial ou aprovada, e foi desativado”.

A Meta também enfrentou uma situação semelhante, com funcionários a tentarem aumentar o consumo de tokens para melhorar a sua posição nos rankings internos.

Este fenómeno mostra que, ao incluir o uso de IA na avaliação de desempenho, as empresas podem ter um efeito contrário, distorcendo os incentivos dos funcionários para um consumo inútil de recursos computacionais.

A Amazon passou a usar um indicador de “implantação normalizada” em substituição do consumo de tokens, focando-se na capacidade dos engenheiros de gerar continuamente código com valor prático através da IA.

É importante notar que, este ano, o investimento de capital da Amazon deverá atingir os 200 mil milhões de dólares, com a maior parte a ser direcionada para IA e infraestruturas de data centers.

Quatro principais obstáculos: por que o investimento em IA não traz retorno

Segundo a Axios, a adoção de IA empresarial enfrenta quatro obstáculos estruturais.

Escolha incorreta de casos de uso. Sophia Velastegui, CEO da Velastegui Ventures e ex-CTO de IA na Microsoft, afirma que a maioria das pessoas tende a usar IA para automatizar tarefas que não gostam, em vez de focar nas que trazem maior valor para a empresa.

Ela acredita que as empresas devem concentrar os recursos de IA em cenários que possam impulsionar diretamente a receita, em vez de expandir de forma cega.

Falta de controlo de custos. Consultas de IA não são gratuitas; os planos empresariais cobram por token, e mesmo consultas simples do dia a dia podem acumular custos consideráveis rapidamente, algo que muitas áreas de negócio não compreendem claramente.

As pessoas são o maior obstáculo. Velastegui classifica a prática comum de “espalhar” autorizações de IA nas empresas como um caminho que não traz retorno real.

As empresas fornecem muitas ferramentas de IA aos funcionários, mas sem orientação eficaz ou foco, levando a uma baixa adoção efetiva.

Preocupações com a abertura de dados. Josh Pantony, CEO da Boosted.ai, que se concentra em ferramentas de IA para o setor financeiro, aponta que, quando as empresas hesitam em abrir dados internos por motivos de segurança, a eficácia das soluções de IA é severamente prejudicada, tornando o retorno do investimento difícil de justificar.

Economia de tokens: a nova variável central na narrativa de IA

Por trás desta discussão, está uma lógica de investimento mais complexa a ser reestruturada.

Segundo o Wall Street Journal, citando Rich Privorotsky, chefe do departamento One-Delta da Goldman Sachs, o núcleo da negociação de IA mudou de “a viabilidade técnica” para “a capacidade de suportar custos”.

A DeepSeek reduziu o preço do token em 75%, enquanto a Xiaomi MiMo quase cortou o preço em 99%, o que pode desencadear uma “guerra de preços” semelhante à de subsídios.

Privorotsky aponta que as limitações de infraestrutura eventualmente serão resolvidas, e o mercado não deve pagar um prémio excessivo por problemas que ainda vão ser resolvidos.

Ele levanta a hipótese de que tokens mais baratos possam substituir rapidamente serviços de inferência de alto custo. Se a expansão da procura tiver um atraso temporal, as receitas de fornecedores de serviços em nuvem, empresas de modelos e infraestruturas de IA podem enfrentar pressões de fase.

Acredita que a racionalização dos gastos com tokens pode tornar-se uma questão importante na direção das empresas já no segundo e terceiro trimestres deste ano, sendo tão relevante quanto a narrativa de crescimento de IA.

De acordo com o Índice de Despesas com Tokens de LLM da Bloomberg Silicon Data, o preço do token subiu cerca de 65% desde o final de fevereiro, e os preços de software de IA nos EUA aumentaram entre 20% e 37% no último ano.

Esta tendência de custos está a levar as empresas a reavaliar estratégias de aquisição de IA. Quando “obter 90% de resultados com 10% do custo” se torna cada vez mais viável, a dependência de modelos de ponta de alto custo pode diminuir de forma sistémica.

Ali Ansari, CEO da Micro1, uma empresa de treino de modelos de IA, afirma que as empresas estão a passar por uma “oscilações saudáveis” entre uso excessivo e uso racional de IA. Ele acredita que:

Atualmente, a única área realmente eficaz da IA é a programação.

A disputa entre otimismo e pessimismo: a mesma realidade, duas interpretações

No que diz respeito ao retorno do investimento em IA, os mesmos dados podem apontar conclusões completamente diferentes, dependendo do quadro de análise.

A perspetiva otimista vê a confusão atual como uma dor de crescimento normal durante a transformação.

Segundo Jim Schneider, da Goldman Sachs, em início de maio, até 2030, a IA baseada em agentes impulsionará um crescimento de 24 vezes no consumo de tokens, e os gross margins de grandes provedores de serviços em nuvem e modelos irão tornar-se positivos nos próximos 3 a 12 meses.

A análise económica do JPMorgan também revela que, em início de 2026, o uso de pacotes Python no PyPI terá um crescimento súbito, algo que não aconteceu na estreia do ChatGPT em 2022, indicando uma verdadeira melhoria na produtividade.

Por outro lado, a perspetiva pessimista, apresentada pelo analista de semicondutores da Goldman Sachs, Jim Covello, em relatório de abril, explica que quase todo valor na cadeia de fornecimento de IA está a ir para as empresas de semicondutores, algo sem precedentes e insustentável na história. As empresas de chips deveriam beneficiar-se quando os clientes ganham, mas nesta fase, a sua prosperidade tem sido à custa do consumo na parte superior de toda a cadeia.

Ambas as narrativas coexistem, e o desfecho ainda não está claro. O que se sabe é que a equação simplista de “crescimento do consumo de tokens igual a sucesso na transformação de IA” foi quebrada.

Desde o caso extremo de gastar 500 milhões de dólares num mês, até ao encerramento de rankings internos na Amazon, os investimentos em IA estão a ser sujeitos a uma avaliação de retorno mais rigorosa. Quanto valor real a próxima conta de IA poderá gerar será o verdadeiro momento de julgamento desta grande aposta.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado