A Zhipu aumentou o preço pela terceira vez este ano, subindo mais 10%, enquanto os grandes modelos nacionais abandonam coletivamente a guerra de preços

robot
Geração de resumo em curso

Pergunta à IA · Quais são os fatores que impulsionam a coletiva desistência da guerra de preços pelos grandes modelos nacionais de IA?

Zhipu mais uma vez aumenta o preço. Em 8 de abril, a Zhipu lançou oficialmente e open source seu modelo GLM-5.1, e a plataforma de agregação de modelos OpenRouter mostrou que a Zhipu GLM aumentou novamente o preço em 10%. Após o ajuste, o preço por token de cache no cenário de codificação do GLM-5.1 já se aproxima do nível do Claude Sonnet 4.6 da Anthropic. Até o momento, a Zhipu (2513.HK) subiu mais de 14% durante o pregão, atingindo 888,5 dólares de Hong Kong, com valor de mercado de 396,1 bilhões de dólares de Hong Kong.

Zhipu recentemente aumentou o preço três vezes, mais 10%

Este já é o terceiro aumento de preço recente da Zhipu. Após lançar seu novo modelo de ponta GLM-5 em 12 de fevereiro deste ano, a Zhipu já havia ajustado o preço do seu pacote GLM Coding Plan, com um aumento total de pelo menos 30%. Em 16 de março, a Zhipu lançou o primeiro modelo geral do mundo otimizado profundamente para o cenário de “lagosta”, o GLM-5-Turbo, e também aumentou o preço da API do GLM-5-Turbo em 20%.

Em 8 de abril, a plataforma de agregação de modelos OpenRouter mostrou que a Zhipu GLM4 aumentou novamente o preço em 10%. Atualmente, o preço de entrada do GLM-5 Turbo é de 1,2 dólares por milhão, o preço de saída é de 4 dólares por milhão, e o recém-lançado GLM-5.1 tem um preço de entrada de 1,26 dólares por milhão e preço de saída de 3,96 dólares por milhão. Assim, o GLM-5.1 tem um aumento de 5% no preço de entrada em relação à geração anterior, e uma leve queda de 1% no preço de saída.

O recém-lançado GLM-5.1 mantém sua liderança na capacidade de programação, com uma pontuação média global de 3º lugar, primeiro nacional e primeiro de código aberto nos três principais benchmarks de avaliação de código SWE-bench Pro, Terminal-Bench e NL2Repo; além disso, na avaliação mais próxima do desenvolvimento de software real, o SWE-bench Pro, o modelo nacional superou pela primeira vez o Opus 4.6, atingindo a melhor marca global.

Além disso, diferentemente dos modelos atuais, que operam principalmente com interações de minuto, o GLM-5.1 pode trabalhar de forma contínua e autônoma por até 8 horas em uma única tarefa, sendo este o maior destaque do lançamento. Durante a execução, o modelo pode planejar, executar, testar de forma autônoma, mudar de estratégia ao encontrar obstáculos, corrigir erros por conta própria e entregar resultados completos de nível de engenharia.

A Zhipu lançou recentemente seu primeiro relatório anual após a listagem. Os resultados financeiros mostram que, até março deste ano, o preço de chamadas de API da Zhipu aumentou 83% em relação ao final do ano passado, mas a demanda ainda é alta. O CEO da Zhipu, Zhang Peng, afirmou que há muitas empresas oferecendo serviços de API baseados em poder de computação no mercado, e a aceitação do aumento de preços pela clientela, além da contínua escolha por seus modelos, demonstra que sua capacidade é realmente líder. “Acredito que, a longo prazo, o preço é fundamentalmente decidido pelo valor. Recursos que podem substituir efetivamente a força de trabalho, aumentar a eficiência de conversão e o nível de inteligência são escassos e valiosos. Estamos mais focados no valor criado por token e no valor que trazemos aos clientes. Somente quando os clientes reconhecem esse valor, eles estarão dispostos a pagar mais para usar. Acredito que o poder de definição de preços ainda é determinado pela nossa força tecnológica e pela posição de liderança trazida pelas tendências de longo prazo.”

Demanda em alta, os grandes modelos nacionais abandonam a guerra de preços

Diferentemente do cenário de um ano atrás, quando a narrativa de guerra de preços permeava os fabricantes de grandes modelos nacionais, neste ano, as empresas do setor começaram coletivamente a aumentar os preços. Em março, Tencent Cloud, Alibaba Cloud e Baidu Intelligent Cloud anunciaram aumentos de preços de seus serviços de computação de IA e produtos relacionados a grandes modelos em uma semana. A Tencent Cloud, por exemplo, aumentou em até 463,13% alguns modelos da série Hun Yuan, a Alibaba Cloud elevou de 5% a 34% o preço de produtos como a placa de computação Pingtouge Zhenwu 810E, e a Baidu Cloud aumentou de 5% a 30% os preços de seus serviços de computação de IA. Diversos modelos que eram gratuitos em fase de testes também encerraram seus períodos de oferta gratuita e passaram a cobrar pelo uso comercial.

Esse movimento é impulsionado, em parte, pelo crescimento explosivo da demanda causado pelo sucesso de várias inteligências artificiais. Fontes confidenciais revelaram que os preços de produtos como a capacidade de computação de IA e armazenamento da Alibaba Cloud aumentaram até 34%, sendo um dos principais motivos o aumento explosivo no uso de tokens de chamadas. “Durante o feriado do Ano Novo Chinês, a aplicação de agentes de IA explodiu, e o negócio MaaS da Alibaba Cloud atingiu seu maior crescimento histórico de janeiro a março deste ano.”

A API MaaS é um modelo de negócio comum entre os fabricantes de modelos, que oferece serviços de chamada de modelos na nuvem por meio de interfaces padronizadas. Em uma teleconferência de resultados financeiros, o CEO da Zhipu, Zhang Peng, mencionou que a capacidade de IA evoluiu de algo utilizável e divertido para resolver problemas cada vez mais complexos e importantes, transformando a chamada e o consumo de tokens em valor econômico real. Além disso, o surgimento de aplicações como “lagosta” e a expectativa de inteligência nativa em dispositivos também farão com que o consumo de API e tokens cresça exponencialmente.

Ele também afirmou que, após anos de desenvolvimento, a indústria de grandes modelos busca um modelo de negócio simples, econômico e eficaz, que permita uma rápida aceleração do crescimento. A API é uma forma de transformar a infraestrutura de IA em recursos econômicos operacionais.

Na teleconferência de resultados do quarto trimestre e do ano fiscal de 2025 da Tencent, a gestão da empresa comentou que a capacidade de infraestrutura básica, como CPUs, já está totalmente reservada. Os fornecedores geralmente priorizam clientes de maior escala e com pedidos mais estáveis, enquanto empresas menores e provedores de nuvem não confiam mais na estabilidade do fornecimento, tendo que recorrer a fornecedores de recursos em grande escala. Esses fornecedores operam com margens de lucro baixas, e quando a demanda aumenta, o setor quase não tem escolha senão aumentar os preços.

GLM0,92%
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar