Primeiro relatório financeiro após a IPO da Zhipu, a maior empresa de modelos de grande escala nacional, com ARR de MaaS atingindo 1,7 mil milhões

2026-04-07 16:04:19

Pergunta ao AI · Como o modelo MaaS da Zhipu consegue aumentar significativamente a margem de lucro?

Em 31 de Março, o unicórnio de modelos de IA Zhipu entregou a sua primeira demonstração anual de desempenho após a sua cotação. Os mais recentes relatórios financeiros mostram que, no ano até 31 de Dezembro de 2025, a Zhipu atingiu uma receita anual de mais de 724 milhões de yuan, um aumento de 131,9% em termos homólogos. Para comparação, de 2022 a 2024, a empresa registou receitas anuais de 57 milhões de yuan, 125 milhões de yuan e 312 milhões de yuan, respetivamente, apresentando uma tendência de crescimento continuamente acelerado.

Em termos de dimensão da receita, a Zhipu já se tornou a maior empresa de modelos de IA a nível doméstico em termos de volume de receitas. Como referência, outra empresa de modelos de IA cotada em Hong Kong, a MiniMax, teve uma receita total em 2025 de cerca de 79,04 milhões de dólares. Em termos de modelo de negócio, os dois caminhos das empresas também se diferenciaram. A MiniMax dá mais ênfase a produtos de aplicações nativas de IA, enquanto a Zhipu utiliza sobretudo o modelo de modelos e serviços (MaaS), fornecendo serviços inteligentes a clientes empresariais e a programadores através de chamadas via API.

Ao analisar os relatórios financeiros desta vez da Zhipu, um indicador central que merece atenção é que a sua plataforma MaaS API tem um ARR (receita recorrente anual) de cerca de 1,7 mil milhões de yuan, 60 vezes mais do que no ano anterior. O ARR é normalmente usado para medir a capacidade de receitas sustentáveis de uma empresa, conseguindo refletir a saúde do negócio. No modelo MaaS, este indicador consegue refletir melhor se os clientes continuam a usar o modelo de forma recorrente, consumindo Tokens de forma estável, em vez de depender do impulso de receitas geradas por projectos pontuais.

No passado, a perceção do mercado sobre a Zhipu era mais semelhante à de uma empresa de modelos de IA orientada por projectos. Porém, à medida que a estrutura de receitas da Zhipu passa para um modelo MaaS com base em chamadas de API, a lógica do crescimento da receita também está a mudar: já não depende de um único projeto, mas sim de comportamentos contínuos de utilização do modelo.

De certo modo, o caminho da Zhipu faz lembrar sem dificuldade a empresa de IA líder a nível global, a Anthropic. Por um lado, reforça continuamente as capacidades do modelo de base, elevando o limite do modelo. Por outro lado, transforma Tokens no formato de produto central, impulsionando o crescimento através de um ecossistema de programadores e de uma utilização profunda por clientes de nível empresarial. Nesta lógica, a Zhipu está gradualmente a tornar-se um exemplo de empresa de modelos na China que está mais próxima do percurso de desenvolvimento da Anthropic.

Romper o impasse do MaaS “aumenta a receita mas não aumenta o lucro” : aumentar o preço sem reduzir o volume, regressar à essência comercial

Durante muito tempo, existe uma dúvida típica do mercado sobre o modelo MaaS: se está facilmente condenado a cair num dilema de “aumentar a receita mas não o lucro”. As razões são as seguintes: as receitas do MaaS estão diretamente ligadas ao consumo de Tokens; por sua vez, por trás dos Tokens existe um custo de capacidade de computação que ocorre continuamente. Quando receitas e custos ficam ligados na mesma cadeia, à medida que a escala aumenta, a margem de lucro tende frequentemente a ser comprimida sob pressão crescente. Um pequeno deslize pode empurrar a empresa para uma situação embaraçosa de “quanto mais se faz, mais se ganha pouco”.

No entanto, o mais recente relatório financeiro da Zhipu divulga sinais bastante positivos. A margem de lucro bruto da sua plataforma MaaS API aumentou de forma significativa, passando de 3,3% em 2024 para 18,9% em 2025, com melhorias evidentes na capacidade de rentabilidade global. Em conjugação com os dados divulgados no prospecto anterior, durante o período histórico de 2022 a 2024, em que a Zhipu apresentou resultados, a sua margem de lucro bruto global manteve-se relativamente estável, mantendo-se durante um longo período acima de 50%.

Para além de maximizar a otimização da eficiência da inferência do modelo e comprimir os custos de Tokens ao mínimo absoluto, outro fator-chave que impulsionou a melhoria da margem de lucro bruto é a quota continuamente crescente de clientes líderes de alto valor.

De acordo com o que foi divulgado no relatório, mais de 4 milhões de utilizadores empresariais e programadores estão a aceder continuamente às capacidades dos modelos da Zhipu em ambientes de produção reais, cobrindo 218 países e regiões no mundo. Entre as 10 principais empresas de internet da China, 9 estão a usar modelos GLM da Zhipu. Por exemplo, no caso do modelo GLM-5, dentro de 24 horas após o seu lançamento, recebeu integrações oficiais de várias plataformas de topo como TRAE/Coze da ByteDance, Qoder da Alibaba, CodeBuddy da Tencent, CatPaw da Meituan, entre outras.

Por outro lado, esses clientes líderes são mais sensíveis ao desempenho do modelo e, em termos de preços, têm tolerância relativamente maior. Um sinal importante é que, em Fevereiro deste ano, a Zhipu anunciou um ajuste estrutural na tabela de preços do pacote GLMCodingPlan: o aumento global começou nos 30%, com o objetivo de garantir estabilidade e qualidade do serviço sob carga elevada. Embora o preço da API tenha subido 83% no primeiro trimestre, o número de chamadas não diminuiu; pelo contrário, aumentou. Isto indica que os clientes estão verdadeiramente dispostos a pagar pelo efeito, e não a ceder ao preço.

Para a Zhipu, isto cria também um ciclo de feedback positivo trazido pelo aumento de preços. Preços mais altos, até certo ponto, filtram clientes de alto valor que dão mais importância ao desempenho; estes clientes tendem a ter taxas de retenção mais elevadas e maior profundidade de utilização, reforçando ainda mais a qualidade do negócio e a sua capacidade de crescimento sustentado.

Na sub-conferência do Fórum anual de 2026 Zhongguancun, realizada a 27 de Março, o CEO da Zhipu, Zhang Peng, ao falar sobre o aumento do preço dos modelos, afirmou que, à medida que a execução do modelo em tarefas complexas prolonga continuamente as cadeias de pensamento e raciocínio, a quantidade de Tokens necessária para concluir uma tarefa pode chegar a 10 vezes ou até 100 vezes a de perguntas e respostas simples. Assim, o ajuste proporcional de preços é, na essência, um resultado natural da mudança de custos. Ao mesmo tempo, a melhoria da capacidade do modelo também eleva os custos de serviços, esperando-se que sejam progressivamente trazidos de volta para uma gama de valor comercial normal.

“Dependermos a longo prazo de uma concorrência de preços baixos, na verdade não é favorável ao desenvolvimento de toda a indústria; esta é também uma das nossas considerações importantes.” Zhang Peng acrescentou ainda: “Queremos, através deste tipo de abordagem, formar um ciclo fechado mais saudável na trajetória de comercialização, otimizando continuamente a capacidade dos modelos e fornecendo de forma mais duradoura e estável modelos melhores e os respetivos serviços de Tokens para todos.”

No fim, o julgamento central da Zhipu pode ser resumido assim: o limite inteligente determina o poder de definir preços, e a escala de consumo de Tokens determina a dimensão de valor.

Dito de outra forma, quanto mais forte for a capacidade do modelo, maior será a sua substituibilidade nos cenários-chave, e maior será a margem de negociação que consegue suportar. E apenas quando o modelo consegue alcançar chamadas em grande escala e de forma contínua, formando um consumo estável de Tokens, é que o valor comercial pode realmente ser libertado. Assim, conclui-se que o valor comercial da AGI, na essência, é o resultado da ação conjunta do limite inteligente e da escala de consumo de Tokens.

Quando os Tokens se tornam uma nova moeda, a Zhipu apresenta um novo sistema de avaliação do valor da IA

Ao observar a primeira demonstração anual da Zhipu, não é difícil perceber que está a formar-se rapidamente uma roda dentada positiva construída em torno do MaaS. Em termos concretos, à medida que as capacidades do modelo continuam a melhorar, atrai mais empresas e programadores para integrarem-se. A ampliação da escala de integração impulsiona o aumento da quantidade de chamadas de Tokens, promovendo o crescimento da receita. E, em seguida, as receitas em crescimento contínuo permitem reembolsar o treino do modelo e o investimento em capacidade de computação, reforçando ainda mais as capacidades do modelo. Assim, este ciclo iterativo e incremental forma um ciclo de crescimento auto-reforçado.

Nesta roda dentada MaaS, a variável mais crucial é a melhoria contínua das próprias capacidades do modelo. A Zhipu já tinha proposto que a elevação do limite da inteligência é a “primeira lei” única na era dos grandes modelos e até da inteligência artificial geral.

Ao longo do ano passado, a base de modelos da Zhipu concluiu mais de 5 iterações importantes, realizando uma evolução contínua de GLM-4.5 para GLM-5-Turbo. Em rankings de testes autorizados como Artificial Analysis, os modelos da série GLM estão na primeira linha a nível mundial, apenas atrás de modelos avançados como Google Gemini, OpenAI GPT e Anthropic Claude; simultaneamente, ficam à frente de muitos modelos nacionais.

A mudança é ainda mais evidente: os modelos da série GLM estão a evoluir de uma orientação por “conhecimento” para uma orientação por “tarefas”, deixando de se limitar a bases de conhecimento de tipo perguntas e respostas, e passando a ter capacidades de agentes inteligentes capazes de concluir tarefas complexas de forma independente. O GLM-5 é precisamente um produto de transformação sob a tendência de “Agentic Engineering”. De acordo com a apresentação oficial, o GLM-5 obteve resultados SOTA de código aberto em capacidades de Coding e de agentes, e a experiência de utilização em cenários reais de programação já está muito próxima da Claude Opus 4.5; em particular, é especialmente forte em engenharia de sistemas complexos e em tarefas de agentes de longo alcance.

O GLM-5-Turbo lançado mais recentemente no presente mês é definido como “um modelo de base otimizado em profundidade para cenários de OpenClaw (lagosta)”. Durante a fase de treino, este modelo foi especificamente otimizado para necessidades centrais da tarefa de lagosta, reforçando capacidades como chamadas de ferramentas, obediência a instruções, tarefas temporizadas e contínuas, execução de longas cadeias, entre outras, resolvendo de forma eficaz muitos problemas que os modelos generalistas enfrentam em cenários reais de lagosta.

Recentemente, o projeto de agentes de código aberto OpenClaw tem provocado uma vaga de implementação em ambientes nacionais e internacionais. Porém, devido a fatores como o elevado patamar de implementação local do OpenClaw e os custos de consumo de Tokens extremamente altos, muitos utilizadores optam por soluções de “implementação com um clique” fornecidas por fornecedores de cloud nacionais e por fabricantes de modelos. Empresas de modelos de base como a Zhipu beneficiaram desta nova vaga de OpenClaw.

Em 10 de Março, a Zhipu lançou oficialmente o AutoClaw (lagosta australiana), definindo-o como “o primeiro OpenClaw local com instalação verdadeiramente com um clique no país”. O AutoClaw encapsula 50+ Skills e APIs principais e suporta integração com ferramentas de comunicação instantânea como o Feishu com um clique. Na plataforma agregadora de APIs de modelos de IA mais grande do mundo, a OpenRouter, o volume de chamadas do GLM-5-Turbo nesta semana chegou a 9660 mil milhões de Tokens, ficando no top 10 global. A Zhipu tornou-se um dos fornecedores nacionais com o maior consumo pago de Tokens.

Os Tokens estão a tornar-se, progressivamente, uma “nova moeda” na era da economia inteligente. Como a unidade mínima para os modelos processarem informação, o volume de chamadas de Tokens é visto na indústria, de forma generalizada, como um indicador importante para medir a atividade do modelo e a escala de processamento real. Huang Renxun, fundador e CEO da Nvidia, afirmou diretamente que Tokens são “uma nova commodity de grande escala”; a Alibaba também criou um novo grupo de negócios, com Token Hub como linha principal. Ao mesmo tempo, os agentes complexos da nova geração, representados pelo OpenClaw, impulsionam o consumo de Tokens para uma fase de crescimento exponencial, assinalando a aceleração de uma nova abordagem em que os Tokens aumentam rapidamente.

Com a rápida expansão da escala do consumo de Tokens, a indústria necessita urgentemente de um novo quadro para medir como os Tokens são convertidos de forma mais eficiente em valor real. Neste contexto, a Zhipu propôs o conceito de “força de arquitetura de Tokens” (TAC) e definiu-o como: TAC = quantidade de inteligência chamada × qualidade da inteligência × eficiência na conversão em valor económico.

De forma específica, “quantidade” refere-se ao número de Tokens chamados diariamente por empresas e indivíduos, bem como à escala das tarefas entregues para tratamento por IA. “Qualidade” mede se o modelo que depende dos Tokens é suficientemente inteligente e fiável, e se consegue produzir resultados que possam ser entregues em cenários complexos. Já “eficiência” centra-se em saber se é possível encontrar cenários adequados para que a IA se converta verdadeiramente em produção económica mensurável.

A longo prazo, a capacidade central de competitividade de organizações e indivíduos vai depender cada vez mais do seu nível de TAC. Em comparação com um mero fornecedor de grandes modelos, o objetivo da Zhipu assemelha-se mais a construir infraestruturas de TAC para toda a sociedade, ajudando vários tipos de organizações e indivíduos a orquestrar e aplicar recursos inteligentes de forma eficiente, e a convertê-los continuamente em valor económico que seja concretizável e mensurável.

E esta trajetória de desenvolvimento já foi confirmada, de forma preliminar, nos mais recentes relatórios financeiros divulgados pela Zhipu. Ao voltar atrás, talvez o significado central deste relatório financeiro resida em a Zhipu demonstrar uma lógica de crescimento relativamente clara e coerente: ao elevar continuamente o limite de inteligência, reforçando gradualmente a capacidade de definição de preços; em seguida, impulsionando o crescimento da receita de API; e, ao mesmo tempo, otimizando de forma contínua a estrutura global de margem de lucro bruto, validando assim a sustentabilidade do modelo de negócio.

Se analisarmos a partir da perspetiva de “Anthropic versão China”, a lógica de avaliação da Zhipu também não deve continuar a ser ancorada em moldes antigos de empresas de software tradicionais ou empresas orientadas por projetos; deve antes mudar para um sistema de medição com o MaaS como núcleo, com foco na taxa de penetração da plataforma, na escala de consumo de Tokens e na capacidade de controlo do ecossistema representada pela TAC. Neste novo sistema de coordenadas, o espaço de imaginação de longo prazo da Zhipu só agora foi verdadeiramente aberto.

GLM-4,64%

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.