Relatório aprofundado do Goldman Sachs: O ponto de inflexão iminente decodificando a economia dos agentes de IA

robot
Geração de resumo em curso

Agente de IA (Agentic AI) está transformando a indústria de inteligência artificial de uma narrativa de custos para uma narrativa de lucros. O Goldman Sachs acredita que, à medida que o consumo de tokens está prestes a experimentar um crescimento exponencial, e o custo de capacidade computacional subjacente caiu mais rápido do que a redução no preço do token, o ponto de inflexão na margem de lucro dos grandes fornecedores de nuvem e de modelos de grande escala pode ocorrer nos próximos 3 a 12 meses.

De acordo com a Trading台追风, um relatório do Goldman Sachs divulgado em 5 de maio afirma que, até 2030, os agentes de IA para consumidores e empresas impulsionarão um crescimento de 24 vezes no consumo global de tokens em relação ao nível de 2026, atingindo cerca de 120 quintilhões de tokens por mês; se considerarmos a adoção máxima de agentes empresariais em 2040, esse número se ampliará para 55 vezes.

Ao mesmo tempo, as curvas de preço e custo do Goldman Sachs mostram que o preço do token para modelos de grande escala se estabilizou ou até apresentou uma ligeira recuperação após uma queda de cerca de 40% ao ano anteriormente; ao mesmo tempo, o custo de capacidade computacional por token impulsionado por chips como Nvidia, AMD, TPU do Google e Trainium da Marvell continua a diminuir a uma taxa de 60% a 70% ao ano, e a diferença entre as curvas está abrindo espaço para lucros na indústria. Os investimentos em infraestrutura de IA em grande escala podem se tornar mais sustentáveis devido à melhora na margem de lucro.

Ponto de inflexão na economia do Token: custos caem mais rápido que preços, espaço de lucro se abre

O argumento central do relatório do Goldman Sachs é que a indústria de IA está passando de uma fase de “incerteza na economia de inferência, potencialmente diluindo lucros” para uma nova fase de “incremento de tokens com margens marginais atraentes”.

Na primeira fase do ciclo de IA, os investidores geralmente consideram capacidade computacional e tokens como fatores de custo — mais uso significa maior carga de inferência, mais aceleradores, mais energia e maiores investimentos de capital. Mas as curvas de preço e custo do Goldman Sachs indicam que essa lógica está mudando.

Embora o preço do token para modelos de grande escala tenha caído significativamente, ele agora se estabilizou ou até apresentou uma recuperação em alguns casos; ao mesmo tempo, o custo total de capacidade por token impulsionado por Nvidia, TPU do Google (Broadcom), AMD e Trainium (Marvell) continua a diminuir rapidamente e de forma contínua. Se o preço do token permanecer acima do custo, a adoção de agentes de IA aumentará a margem de lucro positiva, e não apenas a receita.

O Goldman Sachs também aponta que a IA de agentes pode criar um ciclo econômico auto reforçador: custos de capacidade por token mais baixos impulsionam agentes mais ricos e complexos; esses agentes, por sua vez, consomem mais tokens ao usar contextos mais longos, mais ciclos, mais validações e monitoramento contínuo; maior utilização melhora a economia da infraestrutura de IA, apoiando fornecedores a investirem continuamente na qualidade e distribuição do modelo. Essa dinâmica, segundo o Goldman Sachs, difere completamente da narrativa predominante de que “o uso de IA trará custos insustentáveis”.

Por outro lado, o Goldman Sachs também alerta para riscos: nem todas as cargas de trabalho de IA podem garantir um ponto de inflexão de lucro positivo. Para chatbots de texto puro altamente comercializados, a competição ainda pode forçar o preço do token a cair mais rápido que o custo computacional.

Agentes de consumo: de diálogos fragmentados a assistentes “permanentes”, consumo de tokens aumentará 12 vezes

O Goldman Sachs estima que, até 2030, os agentes de IA para consumidores poderão aumentar o consumo global de tokens em 12 vezes, com cerca de 60 quintilhões de tokens adicionais por mês.

O relatório divide os agentes de consumo em duas categorias: uma é a de “sob demanda”, como o OpenAI Operator, Claude Code e outros agentes de navegador, que iniciam tarefas por usuários, planejam, executam e retornam resultados; a outra é a de “permanentes”, como monitoramento de e-mails, gerenciamento de agendas ou assistentes digitais de vida, que operam continuamente em segundo plano. O Goldman Sachs acredita que o maior aumento no consumo de tokens ocorrerá na fase em que os agentes mudarem de tarefas iniciadas pelo usuário para execução contínua em segundo plano — monitorando o contexto e agindo proativamente quando necessário.

Dados simulados indicam que um chatbot LLM comum consome cerca de 1.000 tokens por sessão, enquanto o Copilot embutido consome mais de 5.000 tokens por dia, e agentes permanentes podem consumir mais de 100.000 tokens por dia.

O Goldman Sachs prevê que, até 2030, a quantidade diária de consultas de IA aumentará de cerca de 5 bilhões em 2025 para aproximadamente 23 bilhões, sendo que até 30% dessas consultas estarão relacionadas a agentes de busca, compras, viagens, e-mails e produtividade pessoal. Ao mesmo tempo, a participação dos mecanismos de busca tradicionais na quantidade de consultas deve cair de 68% em 2025 para 36% em 2030, enquanto a de aplicações nativas de LLM aumentará de 12% para 31%.

Agentes empresariais: complexidade de fluxo de trabalho impulsiona intensidade de tokens, consumo pode atingir 55 vezes em 2040

O Goldman Sachs estima que os agentes de IA para empresas se tornarão o maior multiplicador de tokens, impulsionando o consumo global de tokens 24 vezes até 2030 e, em seu pico em 2040, chegando a 55 vezes, com cargas de trabalho empresariais representando mais de 70% do uso total de tokens.

A maior intensidade de tokens dos agentes empresariais em relação aos de consumo se deve ao fato de que seus fluxos de trabalho exigem operações mais complexas e precisas — monitoramento de tarefas, recuperação de contexto, inferência de anomalias, validação de saídas, atualização de sistemas e reporte contínuo de problemas ao longo do dia. Além disso, esses agentes frequentemente envolvem entradas multimodais mais pesadas (voz, imagens, documentos, atividades na tela, dados de aplicativos, logs e registros estruturados), o que aumenta significativamente a intensidade de tokens.

O Goldman Sachs construiu simulações de agentes para diferentes profissões, quantificando o consumo de tokens.

Os resultados mostram que um agente de programação consome cerca de 7 milhões de tokens por dia, com custo de API de aproximadamente 13 dólares por dia, bem abaixo do custo humano; um agente de call center consome cerca de 2 milhões de tokens por dia, mas, se depender de processamento de voz em tempo real, o custo pode chegar a 92 dólares por dia, tornando a automação completa por voz economicamente inviável; um agente de entrada de dados consome cerca de 25 milhões de tokens por dia, com custo de aproximadamente 60 dólares, ainda abaixo do custo humano.

O Goldman Sachs afirma que a velocidade de adoção de agentes empresariais dependerá de variáveis como volume de tokens, custo de API, combinação de modalidades e complexidade de implementação. Fluxos de trabalho baseados em texto e com ecossistemas de ferramentas maduros serão os primeiros a escalar; fluxos de trabalho centrados em voz ou com integração profunda a sistemas de backend podem avançar mais lentamente.

Na curva de adoção, o Goldman Sachs acredita que os agentes de IA empresariais provavelmente seguirão uma curva em forma de S, com uma taxa de adoção máxima de cerca de 35% a 40% de trabalhadores do conhecimento, atingindo o pico em aproximadamente 15 anos, mais rápido que a mediana histórica de difusão tecnológica (29 anos).

Sustentabilidade dos investimentos de capital: melhorias de lucro oferecem maior espaço para grandes fornecedores de nuvem

Uma conclusão chave do relatório do Goldman Sachs é que a melhora na margem de lucro dos grandes fornecedores de nuvem tornará os investimentos atuais em infraestrutura mais sustentáveis, aliviando uma das principais preocupações do mercado quanto ao retorno do capital em IA.

O relatório aponta que, atualmente, os operadores ainda enfrentam restrições de oferta para atender à demanda presente e futura por capacidade computacional, com Google e Meta já revisando suas projeções de gastos de capital para 2026, e a Amazon reiterando sua estratégia de altos investimentos após o relatório trimestral. O Goldman Sachs espera que, com o ponto de inflexão de lucros se aproximando, os investidores busquem cada vez mais evidências de retorno visível.

No que diz respeito a ações específicas, o Goldman Sachs acredita que a aceleração do crescimento da receita da AWS (com aumento de 28% no trimestre) e seu estoque de pedidos de 364 bilhões de dólares, bem como o crescimento de 63% na receita de nuvem do Google no trimestre e o aumento quase dobrado de pedidos pendentes para cerca de 460 bilhões de dólares, justificam uma visão positiva. Para o Meta, o crescimento acelerado de sua receita de publicidade, superando a média do setor, e a contribuição contínua da IA para aumentar o engajamento e monetização de anúncios também sustentam uma visão otimista.

No setor de software, custos de tokens mais baixos facilitam a incorporação de agentes em produtos existentes sem impactar significativamente a margem de lucro, além de permitir a precificação baseada em resultados, produtividade ou unidades de trabalho, ampliando o mercado endereçável. Para empresas de serviços de TI, à medida que agentes transformam o consumo de IA de ferramentas independentes para fluxos de trabalho empresariais altamente integrados, a demanda por integração, governança e orquestração de hospedagem aumentará substancialmente, com a Accenture sendo vista como uma das principais beneficiárias dessa tendência.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar