Token é capacidade de produção A guerra de preços de grandes modelos começou

robot
Geração de resumo em curso

A jornalista Yuan Chuanxi do Securities Daily

Recentemente, a febre de implementação de agentes de IA está a varrer todos os setores. Os agentes de IA estão a integrar-se ao ritmo sem precedentes nos cenários do dia a dia de trabalho e vida.

Por trás desta tendência, está uma procura exponencial por poder de processamento — a implementação em larga escala de agentes de IA pessoais tem consumido uma quantidade massiva de Tokens (identificadores numéricos no domínio da computação), ultrapassando rapidamente as fronteiras de custo dos fabricantes de grandes modelos.

Recentemente, empresas nacionais de IA como Beijing Zhipu Huazhang Technology Co., Ltd. (doravante “Zhipu”), Tencent Cloud, entre outras, divulgaram aumentos de preços nos seus produtos de capacidade de computação de IA, com alguns a mais de 400%. Esta mudança de estratégia, de “queimar dinheiro para crescer” para “aumentar volume com preços”, não só marca o fim do crescimento selvagem do setor, como também reflete uma profunda mudança na relação entre oferta e procura de capacidade de processamento na era dos agentes de IA.

Reinvenção do sistema de preços dos grandes modelos

O sistema de preços na indústria de grandes modelos está a passar por uma reestruturação sistemática, com fabricantes nacionais a acelerarem o ajuste dos preços dos seus produtos. Este fenómeno contrasta fortemente com a guerra de preços de há dois anos.

Em maio de 2024, a ByteDance iniciou a primeira ofensiva de guerra de preços, com o modelo Doubao Pro a 0,0008 yuan por mil Tokens, 99,3% abaixo da média do setor. Seguiram-se reduções de 97% nos preços do principal modelo Tongyi Qianwen da Alibaba Cloud, e dois grandes modelos principais da Baidu, Wenxin, tornaram-se totalmente gratuitos. O modelo Hongyuan da Tencent reduziu o preço até 87,5%. De repente, o setor mergulhou numa onda de cortes de preços.

“Na altura, a lógica era simples: primeiro, fazer os desenvolvedores usarem, a quota de mercado era mais importante que tudo.” revelou um gestor de produto de IA com três anos de experiência ao Securities Daily. “Em 2024, uma grande empresa interna tinha uma meta agressiva de não visar lucro nos próximos três anos, com preços até abaixo do custo de computação.”

Contudo, o efeito marginal de preços baixos diminui rapidamente. Um analista do setor afirmou ao Securities Daily que, embora a guerra de preços de 2024-2025 tenha acelerado a adoção de grandes modelos de IA, também levou a uma situação de “alto investimento, baixo retorno”. Quando o volume de chamadas aos modelos sobe de centenas de bilhões para trilhões, os custos de computação aumentam exponencialmente, tornando insustentável depender apenas de capital para sustentar. A partir do segundo semestre de 2025, algumas PME começaram a reduzir silenciosamente as quotas gratuitas.

“Não se trata apenas de aumentos de preços, mas de uma consequência inevitável da mudança na estrutura de custos.” explicou um responsável técnico de uma grande provedora de cloud ao Securities Daily. “Antes, o setor usava prejuízos para ganhar quota de mercado; em 2026, será preciso pensar na sustentabilidade.”

Inflação de Tokens

Para entender o aumento de preços coletivo dos grandes modelos nacionais, é fundamental compreender o conceito de “Inflação de Tokens”.

Tokens são as unidades mínimas de processamento de texto nos grandes modelos, podendo ser entendidos como unidades de trabalho da IA. Quando se fala em inflação de Tokens, na verdade, refere-se ao aumento súbito na complexidade das tarefas de IA, levando a que o mesmo serviço consuma mais recursos de computação. É como passar de acender uma pequena lâmpada a abrir uma fábrica, com a conta de eletricidade a subir.

Esta “inflação” vem principalmente do crescimento da procura no mercado externo. Em fevereiro de 2026, a plataforma OpenRouter (principal plataforma global de distribuição de APIs de grandes modelos) revelou que, nesse mês, o consumo total de Tokens dos dez principais modelos de IA no mundo ultrapassou 27 trilhões, com os modelos chineses a contribuírem com 14 trilhões, mais de 50%.

“Significa que os grandes modelos nacionais estão a passar de uma procura interna para uma exportação global.” afirmou Zhang Yi, CEO da Guangzhou iMedia Data Intelligence Co., Ltd., em entrevista ao Securities Daily. “Os utilizadores estrangeiros têm hábitos de uso completamente diferentes dos internos.” Os desenvolvedores na Europa e América tendem a integrar grandes modelos em fluxos de trabalho produtivos, com múltiplas chamadas de ferramentas, buscas de contexto longo e geração de código, consumindo de três a cinco vezes mais Tokens por chamada API do que no mercado doméstico.

Se o mercado externo é uma causa externa, a implementação em larga escala de agentes de IA é a causa interna do aumento dos custos de computação.

Ao contrário do período inicial dos chatbots, os agentes de IA possuem um ciclo fechado de “perceber-decidir-executar”, podendo completar tarefas complexas autonomamente. Por exemplo, no setor de risco financeiro: um agente de IA para aprovação de crédito realiza a recuperação de perfil do utilizador (contexto longo), consulta de dados de crédito (uso de ferramentas), avaliação de risco (raciocínio) e geração de relatórios (saída), consumindo dezenas de milhares de Tokens ao longo do processo.

Vários fatores combinados resultam em números impressionantes. Segundo a China United Minsheng Securities, o consumo diário total de Tokens na China passou de 1 trilhão no início de 2024 para 180 trilhões em fevereiro de 2026. Com a evolução dos agentes de IA para multimodalidade e colaboração entre múltiplos agentes, este número continua a acelerar.

A inversão na relação de oferta e procura acaba por refletir-se na estrutura de preços. Desde 2025, a infraestrutura global de computação de IA enfrenta escassez de capacidade, devido à tensão na oferta de memória de alta largura de banda (HBM) e GPUs de processos avançados, levando a aumentos significativos nos custos de aquisição de servidores.

Por exemplo, em 17 de março, a Alibaba Cloud anunciou que, devido à explosão da procura global por IA e ao aumento dos custos na cadeia de abastecimento, os preços de produtos de capacidade de IA e armazenamento subiram até 34%.

Quando os fabricantes de grandes modelos passam de “vendedores de água” a “consumidores de água”, o aumento de preços torna-se uma escolha rígida para manter a qualidade do serviço. A Zhipu afirmou na sua comunicação de ajuste de preços: “O rápido crescimento do número de utilizadores e de chamadas exige que aumentemos o investimento em capacidade de processamento.”

Reconstrução do modelo de negócio

O aumento de preços não cobre apenas a lacuna de custos, mas também uma profunda reestruturação da lógica de negócio do setor.

“Quando a guerra de preços terminar, a verdadeira batalha de valor começará.” afirmou o responsável técnico de uma grande provedora de cloud. “2026 será o ano de ouro para a comercialização em larga escala de IA, com o foco a passar de possuir apenas capacidade de processamento para oferecer serviços de modelos eficientes, estáveis e de baixo custo.”

Atualmente, a indústria de grandes modelos está a passar de “subsidiar tráfego” para “filtrar valor”. Estratégias de preços baixos iniciais atraíram muitos utilizadores de teste, levando a uma utilização ineficiente de recursos de computação. Uma empresa estimou que 40% das quotas gratuitas eram usadas em chamadas de teste sem aplicação real. Com aumentos moderados de preços, as empresas podem filtrar necessidades não essenciais e garantir estabilidade para clientes de valor. Os aumentos de preços de Zhipu, Tencent Cloud e outros refletem uma tentativa de equilibrar a disposição de pagamento e o retorno sobre investimento (ROI) de clientes empresariais. Esta operação de “aumentar volume com preço” marca a transição do setor chinês de modelos de uma expansão baseada em internet para uma estratégia de precificação baseada em valor.

O membro do Conselho de Economia de Comunicação do Ministério da Indústria e Tecnologia da Informação, Pan Helin, afirmou ao Securities Daily que o aumento de preços não irá suprimir a procura real, mas acelerará a “eliminação do mau pelo bom”. Clientes empresariais, com maior exigência de estabilidade e conformidade, têm uma disposição de pagar e um valor de ciclo de vida muito superiores aos utilizadores de longo prazo, o que dá aos fabricantes de grandes modelos confiança para passar de “pensamento de tráfego” para “precificação de valor”.

Esta mudança está a remodelar toda a cadeia de valor. Os fornecedores de capacidade de processamento (como Nvidia) continuam a beneficiar; os provedores de cloud (como Alibaba Cloud e Tencent Cloud) procuram equilibrar entre vender modelos e vender capacidade de processamento — querendo atrair clientes com serviços de IA, mas sem serem arrastados pelos altos custos de computação; e na camada de aplicação, há uma clara diferenciação: grandes empresas com capacidade de desenvolver internamente (como ByteDance e Baidu) podem ajustar recursos de processamento internamente para mitigar aumentos de custos, enquanto startups e PME que dependem de APIs enfrentam custos crescentes e o risco de encerramento.

Fabricantes de grandes modelos empresariais também começam a focar na profunda transformação da economia de Tokens. Yang Lei, cofundador e diretor executivo da Dipu Technology, afirmou ao Securities Daily: “No futuro, Tokens serão capacidade. Com a reestruturação de setores como desenvolvimento de software, análise de dados e outsourcing de atendimento ao cliente com base em modelos por habilidades, a antiga forma de precificação por pessoa por dia será substituída por uma de consumo de Tokens. Isto representa uma mudança não só na unidade de medida, mas também na paradigma de produtividade.”

Zhang Yi acrescenta que, do ponto de vista da competição global, a inflação de Tokens é também um subproduto do avanço tecnológico dos modelos nacionais. A subida de preços não é o fim, mas o início de uma nova revolução de eficiência. Quem conseguir otimizar continuamente os custos nesta corrida de armamentos de poder de processamento manterá a sua posição na mesa global da era dos agentes de IA.

Ao revisitar a guerra de preços de 2024 e observar os aumentos coletivos atuais, a indústria de grandes modelos chinesa está a passar por uma dolorosa maturidade. A era de preços baixos, que buscava apenas chamar atenção, já terminou. Uma nova era, baseada na eficiência tecnológica, valor para o cliente e ecossistema fechado, está a emergir lentamente na corrente do mercado de Tokens.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar