Zhipu corre loucamente, enquanto perde sangue

GateUser-bd883c58 · 2026-03-31T23:58:41+00:00

Pergunta à IA · O investimento em P&D da Zhipu supera de longe a receita, esse modelo pode ser sustentável? Produzido por｜Equipe de Tecnologia do HuxiuAutor｜Song SihangEditor｜Miao ZhengqingImagem de capa｜Visual ChinaSe existir um negócio em que “para cada 1 yuan de receita, é necessário investir 4,4 yuan em P&D”, será que é um bom negócio?A primeira ação global de modelos de grande escala, Zhipu AI (doravante “Zhipu”), tenta responder a essa questão. Em 31 de março de 2026, Zhipu divulgou seus resultados anuais de 2025, sendo também o primeiro relatório financeiro após sua abertura de capital.O relatório financeiro mostra que, em 2025, Zhipu alcançou uma receita total de 724 milhões de yuans chineses, um aumento de 131,9% em relação ao ano anterior; o custo de vendas aumentou 213,3%, atingindo 427 milhões de yuans. Com esses resultados de receita e custos, a margem bruta da Zhipu cresceu 68,7% em relação ao ano anterior, atingindo 297 milhões de yuans, e a margem bruta consolidada da empresa ao longo do ano também atingiu 41%. E para o mesmo

GateUser-bd883c58

2026-03-31 23:58:41

Pergunta ao AI · O investimento em I&D da Zhipu supera em muito os rendimentos — este modelo consegue manter-se?

Produção｜Grupo Tech HuXiu

Autor｜Song SiHang

Editor｜Miao ZhengQing

Imagem de capa｜Visão da China

Se existisse um negócio em que, para cada 1 yuan de receita gerado, seria necessário investir 4,4 yuan em despesas de I&D, seria um bom negócio?

A Zhipu AI (a seguir, “Zhipu”), a primeira empresa de modelos fundacionais a nível de grandes modelos na bolsa, tenta responder a esta questão. Em 31 de março de 2026, a Zhipu divulgou os resultados anuais de 2025, que também constituem o seu primeiro relatório financeiro desde o IPO.

De acordo com o relatório, ao longo de 2025 a Zhipu gerou uma receita total de 724 milhões de yuan RMB, um aumento de 131,9% em termos homólogos; o custo das vendas aumentou 213,3% para 427 milhões de yuan. Com este desempenho de receitas e custos, a margem bruta da Zhipu cresceu 68,7% homólogo para 297 milhões de yuan; a margem bruta global do ano chegou também a 41%. Já no caso da MiniMax, que é igualmente uma empresa cotada de modelos de grande escala, a margem bruta da Zhipu é muito superior à da MiniMax, que é de 25,4%.

Se decompararmos a composição das receitas, por detrás de uma margem bruta de 41% há uma tendência de segmentação: a margem bruta do negócio de implementação local caiu de 66,0% em 2024 para 48,8% em 2025, enquanto a margem bruta do negócio de implementação em nuvem subiu de 3,3% em 2024 para 18,9% em 2025. (Nota da HuXiu: o negócio de implementação local refere-se à implementação local de modelos de grande escala; o negócio de implementação em nuvem refere-se a plataformas abertas e APIs.) A partir deste ponto, a Zhipu já demonstrou plenamente o seu espaço de rentabilidade.

Mas apesar disso, continua com prejuízos.

Devido às despesas de I&D do mesmo período de 3,18 mil milhões de yuan, o prejuízo líquido ajustado da Zhipu atingiu 3,182 mil milhões de yuan, com o valor do prejuízo a aumentar 29,1% em termos homólogos. O prejuízo no mesmo período equivale a 4,39 vezes a receita total da Zhipu, e também a 10,7 vezes a sua margem bruta. Vale notar que o prejuízo provém principalmente de despesas de I&D. De acordo com o relatório financeiro, em 2025 os custos de I&D da Zhipu foram de 3,184 mil milhões de yuan, um aumento de 44,9%; já os gastos de capital em 2025 foram de 74,70 milhões de yuan.

No relatório, explica-se que o aumento dos custos de I&D se deve principalmente a:

（1）Aumento dos custos dos colaboradores, incluindo expansão da equipa de I&D e aumento das despesas de pagamentos baseados em ações;

（2）Taxas pelos serviços de computação pagos a fornecedores terceiros de capacidade de computação, incluindo a iteração de modelos e investimentos em infraestruturas de treino de modelos mais avançadas.

Mas convém mencionar que os custos de capacidade de computação usados para o treino de modelos de grande escala não entram nas despesas de I&D; são contabilizados separadamente como gastos de capital sob a forma de aluguer de capacidade de computação. No contexto da Zhipu, os custos de capacidade de computação para treino de modelos de grande escala na primeira modalidade referem-se ao custo associado ao uso de GPUs do fornecedor de capacidade durante a duração do treino; esta despesa flexível é contabilizada como custo de I&D. Já a segunda modalidade, em que se bloqueiam recursos de GPU e se assina um contrato de longo prazo com um fornecedor, é contabilizada como gasto de capital.

Comparando com a MiniMax, a Zhipu tem uma escala global maior. Isto deve-se principalmente às diferenças na composição dos negócios e na estrutura organizacional entre as duas empresas. Por exemplo, a dimensão de pessoal da Zhipu é o dobro da da MiniMax, o que simultaneamente faz com que a primeira invista mais em custos de I&D e tenha prejuízos mais graves; enquanto a segunda tem maior eficiência por pessoa.

Empresa	Zhipu（02513.HK）	MiniMax（00100.HK）
Receita total	724 milhões de yuan	540 milhões de yuan（79,038 milhões de USD）
Margem bruta	41,0%	25,4%
Prejuízo líquido ajustado	3,182 mil milhões de yuan	1,730 mil milhões de yuan（251 milhões de USD）
Investimento em I&D	3,180 mil milhões de yuan	1,743 mil milhões de yuan（253 milhões de USD）
Dimensão do pessoal	883 pessoas（até meados de 2025）	385 pessoas（até setembro de 2025）
Prejuízo por 1 yuan de receita	4,4 yuan	3,2 yuan
Capitalização bolsista（31.3.2026）	3092 HKD	2915 mil milhões de HKD

Um ponto a notar neste relatório financeiro é que, tal como a MiniMax, a Zhipu também “colheu o benefício da lagosta vermelha”.

A partir do 1.º trimestre de 2026, o crescimento do desempenho da Zhipu depende principalmente do seu AutoClaw, lançado em março, uma implementação de lagosta com um clique.

De acordo com a explicação do CEO da Zhipu, Zhang Peng, no primeiro trimestre o preço da chamada da API da Zhipu aumentou 83%. Contudo, também coincidiu com o momento de explosão da procura. Nessa altura, a popularidade da lagosta já durava há um mês. Na segunda metade do período após o aumento de preços, a Zhipu começou a implementar a lagosta. Assim, mesmo com o crescimento do preço, o volume de chamadas do modelo GLM da Zhipu continuou a crescer 400%. Segundo o relatório financeiro, dois dias após o plano entrar em funcionamento, o número de utilizadores subscritores já ultrapassou 100.000; após 20 dias, ultrapassou 400.000.

Em paralelo, estão os indicadores de capacidade de rentabilidade da Zhipu — a plataforma de MaaS, que é o foco em que a Zhipu aposta. Segundo informação, a plataforma de APIs de MaaS realiza ARR de 1,7 mil milhões de yuan（cerca de 250 milhões de USD）, um aumento de 60 vezes em termos homólogos.

Ou seja, este relatório financeiro da Zhipu, por um lado, comprova o seu espaço de rentabilidade; por outro lado, os prejuízos não pararam.

A lógica de crescimento da Zhipu mudou, mas ainda não foi reestruturada

No que diz respeito à estrutura global de receitas, a variável mais crítica neste relatório financeiro não é, na verdade, a receita total em si, mas sim a origem das receitas. Ao analisar, em detalhe, as pequenas mudanças na origem das receitas, consegue-se vislumbrar a nova lógica de crescimento da Zhipu e a sua sustentabilidade.

Vendo à letra, o foco do crescimento da Zhipu começou a inclinar-se para a cloud, ou seja, o MaaS. Esta parte representa 26,3% da quota de negócio; em 2024, a implementação em nuvem representava apenas 15,5% do total de receitas. Após a divulgação deste relatório financeiro, a Zhipu também afirmou que o foco estratégico da empresa continuará a ser o MaaS.

No entanto, apesar de, em termos numéricos, a quota do negócio de implementação em nuvem ter aumentado significativamente, há alguns factores variáveis particularmente críticos aqui.

Em primeiro lugar, o motor mais central vem da API. Por outras palavras, o crescimento desta fase da Zhipu é, na essência, o crescimento do volume de chamadas.

Dentro disso, a lagosta (OpenClaw) é a variável mais direta. Com o início da execução automática de tarefas pelo Agent, uma única necessidade corresponde frequentemente a múltiplas rondas de chamadas; o consumo de Token é multiplicado; e, consequentemente, o volume de chamadas da API sobe.

Em segundo lugar, a principal fonte de receitas do MaaS. O relatório financeiro descreve que, entre dez empresas de internet, nove já integraram os modelos da Zhipu.

Há uma mudança digna de nota aqui: estas empresas de internet, em geral, também têm os seus próprios modelos de grande escala, mas não dependem totalmente dos seus modelos; em vez disso, chamam modelos diferentes de acordo com negócios diferentes. Dito de outro modo, mesmo que, no curto prazo, tenham modelos treinados internamente, ainda assim escolhem a Zhipu em cenários específicos. Naturalmente, isto não significa que estas nove grandes empresas de internet vão escolher esta estratégia a longo prazo.

E o volume de chamadas destas empresas representa, em grande medida, metade do bolo das receitas do MaaS da Zhipu. Ou seja, assim que a Zhipu perder qualquer uma destas empresas cliente, isso será um golpe severo para o atual negócio de MaaS.

Terceiro, o crescimento do MaaS também vem do “envio” de Token para fora. No ano passado, a Zhipu já celebrou parcerias com vários países do Médio Oriente e do Sudeste Asiático, exportando capacidades de modelos para as localidades; na essência, trata-se igualmente de gerar receitas através do formato de chamadas de Token.

Em conjunto, um sinal claro emitido por este relatório financeiro é que a Zhipu está a mudar o enredo do crescimento — de implementar localmente com peso para vender modelos, isto é, vender Token.

Mas, pelos resultados, embora as principais receitas da Zhipu ainda dependam da implementação local, o modelo MaaS já mostra uma tendência de crescimento sustentável.

Com base nisto, a Zhipu apresentou ainda um novo conceito: TAC (Token Architecture Capability, capacidade de arquitetura de Token).

De acordo com a sua definição, a TAC é composta por três partes: chamadas inteligentes em volume, qualidade inteligente e eficiência de conversão económica. Em termos simples, trata-se de quantos Tokens são chamados, se essas chamadas são eficazes, e se finalmente conseguem ser convertidas em receita.

Na opinião do autor, após o evento “lagosta”, o setor foi formando progressivamente um consenso: quando os modelos de grande escala têm capacidade de executar tarefas de longo alcance, as chamadas deixam de ser apenas uma entrada e saída única; passam a ser organizadas como um sistema que funciona continuamente.

Então, por trás de uma tarefa, geralmente existe uma correspondência com múltiplas rondas de chamadas, chamadas de ferramentas e até auto-verificação. Os Tokens deixam de ser apenas consumidos; são “orquestrados”, isto é, o utilizador é quem organiza como chamar o modelo de grande escala.

E o facto de a TAC ter sido proposta neste momento também não é difícil de entender.

Nos últimos dois anos, a concorrência no setor de modelos de grande escala girou principalmente em torno do tamanho dos parâmetros, das capacidades dos modelos e dos preços; mas à medida que a guerra de preços se aproxima do fim e as capacidades dos modelos convergem gradualmente, os indicadores já ficam cada vez menos capazes de explicar as diferenças de crescimento entre empresas.

Neste contexto, a Zhipu precisa de um conjunto de novas métricas para responder a uma pergunta mais realista: quando as capacidades dos modelos são parecidas, de onde vem o crescimento?

O “paradoxo dos custos” da Zhipu

Ao abrir a perspetiva para além da Zhipu, para todo o setor, é possível ver que os modelos de negócio dos grandes modelos já começaram a convergir.

Além de Step-Shift de Xingchen, as restantes três empresas de modelos fundacionais têm as suas receitas principais a convergir para as chamadas de API.

Seja a Zhipu, a MiniMax, ou o Outro Lado do Luar, todas estão a seguir o caminho de utilizar o MaaS para captar o crescimento. Mas, pelo menos no caso da Zhipu, este caminho não existia desde o início.

Por exemplo, no caso da Zhipu, nos estágios iniciais do negócio, a fatia do ToG e da implementação privada era extremamente alta, com traços claros de cariz baseado em projetos. Só cerca de meio ano antes do IPO, para tornar o modelo de negócio mais sustentável e com mais espaço para imaginação de escala, a Zhipu começou a transitar de forma mais clara para o MaaS, passando o foco do crescimento para as chamadas de API em cloud.

Pelos resultados, esta transição de facto trouxe mudanças: a quota do MaaS aumentou, o Token tornou-se o indicador central, e a estrutura das receitas começou a aproximar-se da lógica de plataforma.

No entanto, com base na arquitetura atual da Zhipu, uma estrutura em que a implementação local supera a implementação em cloud é difícil de alterar a curto prazo.

Atualmente, o crescimento do MaaS ainda depende fortemente de alguns grandes clientes.

O relatório financeiro mostra que, numa parte significativa das receitas da API da Zhipu, estas provêm de grandes empresas de internet. Embora estas empresas tenham modelos treinados internamente, no funcionamento de casos concretos tendem a escolher chamar capacidades de modelos externos. Este modelo de “chamadas de múltiplos modelos” fornece, de facto, uma procura estável para o MaaS. O problema é que isto não equivale a um crescimento verdadeiramente escalável em grande escala.

Por um lado, os principais volumes de chamadas vêm dos clientes de topo; por outro lado, o mercado de cauda longa ainda não foi realmente aberto. Ou seja, embora a forma de plataforma do MaaS já tenha surgido, não se estabeleceu uma escala de plataforma.

E isto aponta também para outro problema mais central: o custo por Token e a estrutura de receitas.

De acordo com o relatório financeiro, a Zhipu teve um prejuízo total anual de 4,718 mil milhões de yuan em 2025, um aumento de 59,5%. Entre eles, as despesas de I&D atingiram 3,18 mil milhões de yuan, um aumento de 44,9%; os gastos de capital foram de 74,70 milhões de yuan, uma descida de cerca de 83,8% em termos homólogos. O primeiro refere-se aos custos de treino do modelo e aos custos dos colaboradores; o segundo vem de custos como aluguer de capacidade de computação. Em 2025, a Zhipu ajustou a sua forma de aquisição de capacidade de computação: o que antes era um aluguer de capacidade relativamente fixo transformou-se num modelo que combina aluguer de capacidade de computação e compras de serviços; assim, os gastos de capital diminuíram drasticamente.

Então, ao combinar o crescimento do MaaS com estes dois conjuntos de dados acima e abaixo, consegue-se observar uma cadeia lógica muito direta:

se uma empresa quiser impulsionar o crescimento do MaaS, tem de depender das capacidades dos modelos; e para melhorar as capacidades dos modelos, é preciso aumentar continuamente o investimento em I&D. O problema é que os custos de I&D e de computação não diminuem naturalmente com a expansão do volume de chamadas.

Por outras palavras, o crescimento da receita, por si só, já está a empurrar os custos para cima.

Isso faz com que todas as empresas de grandes modelos caiam num dilema estrutural: para obter mais chamadas, é necessário melhorar continuamente as capacidades do modelo; e para melhorar as capacidades do modelo, é necessário aumentar constantemente o investimento.

É por isso que, atualmente, quanto mais rápido o crescimento, mais a pressão sobre os custos aumenta.

Sob este ponto de vista, o problema já não é apenas da Zhipu; trata-se de uma restrição comum que todo o setor de modelos de grande escala enfrenta.

Enquanto esta questão não for resolvida, o MaaS pode trazer crescimento, mas dificilmente traz lucros.

Por que razão a Zhipu quer ser comparável à Anthropic?

Numa conferência telefónica realizada na noite de 31 de março sobre a divulgação do desempenho anual, antes de apresentar os resultados, o CEO da Zhipu, Zhang Peng, mencionou especificamente a empresa de unicórnio de IA dos EUA, a Anthropic, cuja ARR cresceu de 1.000 milhões de USD no final de 2024 para 9.000 milhões de USD no final de 2025.

Na prática, quase todas as principais empresas de grandes modelos estão a tentar fazer benchmarking do caminho seguido pelos EUA.

Entre elas, o Outro Lado do Luar tem os olhos postos no OpenAI, seguindo a rota de “capacidade do modelo + produto + subscrição”; enquanto a Zhipu e a MiniMax tentam aproximar-se do modelo da Anthropic, isto é, enfatizar as capacidades dos modelos fundacionais, emitir capacidade de inferência através de API e construir um ecossistema de programadores.

Mas independentemente da rota escolhida, a essência é transformar o modelo numa infraestrutura e obter receitas em escala através das chamadas.

Atualmente, este caminho já foi validado preliminarmente nos EUA. Seja a OpenAI ou a Anthropic, pode-se demonstrar que, quando as capacidades do modelo são suficientemente fortes, o ecossistema de programadores consegue formar um ciclo de feedback positivo. O problema é que, na China, é difícil replicar esta via.

Em primeiro lugar, há diferenças no sistema de preços.

No mercado dos EUA, os clientes empresariais e os programadores estão mais dispostos a pagar pelas capacidades; as capacidades do modelo podem ser convertidas em prémio. Mas na China, os preços são rapidamente pressionados desde o início. Após dois anos de guerra de preços, o Token é que começou a evoluir gradualmente para “recursos de base”.

Em segundo lugar, há diferenças na estrutura da procura.

O ecossistema de grandes modelos nos EUA depende mais da procura de cauda longa dos programadores; já na China, as chamadas estão mais concentradas nos clientes de topo, como grandes empresas de internet e clientes governamentais e empresariais. Com esta estrutura, o MaaS assemelha-se mais a uma lógica de aquisição concentrada, em vez de ser impulsionado por ecossistemas de programadores.

Em terceiro lugar, há diferenças de custos e de oferta. A disponibilidade de capacidade de computação, a estrutura de chips e o ambiente geral de custos tornam mais difícil para as empresas de modelos nacionais reduzirem custos à medida que ganham escala.

Deste ponto de vista, o dilema da Zhipu torna-se ainda mais fácil de compreender.

Ao revisitar a trajetória de desenvolvimento da internet e da computação em nuvem, a rentabilidade na camada de infraestrutura é normalmente construída após a explosão na camada de aplicações.

Da mesma forma, isto também significa que, nesta fase atual, quer a Zhipu quer outras empresas de modelos de grande escala, precisam de esperar pela validação contínua dos cenários de aplicação para que, então, seja possível surgir um efeito de escala.

GLM2,14%

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.