A utilização de tokens aumenta 10 vezes num ano – não é de admirar que os fabricantes queiram aumentar os preços

robot
Geração de resumo em curso

Impulsionada pelo crescimento explosivo da procura global por IA, pela escassez de recursos computacionais e pelo aumento dos custos de hardware, as fabricantes de grandes modelos e os provedores de serviços em nuvem têm vindo a aumentar os preços recentemente.

No dia 11 de março, a Tencent Cloud foi a primeira a ajustar a sua estratégia de cobrança, elevando o preço de entrada do modelo da série 混元 Tencent HY2.0 Instruct de 0,0008 yuan por mil tokens para 0,004505 yuan por mil tokens, um aumento de 463%; ao mesmo tempo, encerrou a fase de testes gratuitos de modelos de terceiros como GLM 5 e MiniMax, passando a comercialização oficial.

No dia 16 de março, a Zhipu lançou o novo modelo GLM-5-Turbo e aumentou o preço da API em 20%, com uma subida média de 83% em relação à geração anterior, GLM-4.7.

No dia 18 de março, Alibaba Cloud e Baidu Smart Cloud anunciaram ambos o aumento de preços no mesmo dia. Segundo os anúncios oficiais, a Alibaba Cloud ajustará os preços de serviços relacionados a cartões de computação como o 平头哥真武810E e ao serviço CPFS (versão inteligente), com aumentos de até 34%; a Baidu Smart Cloud indicou que os preços de produtos e serviços relacionados à capacidade de IA subirão aproximadamente entre 5% e 30%, e os preços de armazenamento de ficheiros paralelos também aumentarão cerca de 30%. Ambas as empresas justificaram os aumentos de preços com a “explosão da procura global por IA”.

Embora a procura global por IA seja difícil de estimar com precisão, é possível ter uma ideia através dos dados divulgados pela maior plataforma de agregação de APIs do mundo, OpenRouter. Segundo informações, a OpenRouter é uma plataforma que agrega APIs de múltiplos modelos de inteligência artificial, permitindo que utilizadores comuns e desenvolvedores acessem diferentes modelos de LLM através de uma interface unificada, para conversas e chatbots, incluindo GPT-4, Claude, Gemini, Deepseek, entre outros.

Os dados divulgados pela OpenRouter mostram que, na semana de 24 de março de 2025, o volume de tokens utilizados para aceder a grandes modelos através da plataforma foi de 1,62 triliões, e nesta mesma semana, em 9 de março deste ano, esse volume aumentou para 16,90 triliões, um crescimento de dez vezes em um ano. Especialmente desde 30 de janeiro, quando o OpenClaw (“Lagosta”) foi oficialmente lançado, a velocidade de aumento do uso de tokens acelerou ainda mais. Na semana de lançamento do OpenClaw, o volume de tokens utilizados foi de 8,25 triliões, e em pouco mais de um mês, esse número duplicou para 16,90 triliões.

Relatórios do Galaxy Securities indicam que, na primeira semana de março de 2026, o volume de processamento da plataforma atingiu 14,8 triliões de tokens, o dobro do início do ano, sendo que mais da metade do output da plataforma foi gerada por fluxos de trabalho impulsionados por agentes.

Além disso, na semana de 9 de março, quatro grandes modelos nacionais lideraram as estatísticas de uso de tokens. O MiniMax M2.5 liderou com 1,75 triliões, seguido pelo Step 3.5 Flash (Estrela de Salto) e DeepSeek V3.2 com 1,34 triliões e 1,04 triliões, respetivamente, e o Kimi K2.5 ficou na nona posição com 0,56 triliões. Desde que, na semana de 9 de fevereiro, o uso de modelos chineses ultrapassou o dos EUA pela primeira vez, o MiniMax M2.5 mantém-se na liderança pelo quinto semana consecutiva.

Embora a OpenRouter apenas contabilize as chamadas feitas através da sua plataforma, sem incluir os utilizadores que usam APIs diretamente dos fabricantes, dada a sua posição como a maior plataforma de agregação de APIs do mundo, estes dados refletem claramente a força e a enorme procura pelos grandes modelos nacionais.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar