Western Securities: O processo de industrialização da IA acelera-se, e o fabricante nacional líder de modelos ARR alcança um salto significativo

MaticHoleFiller · 2026-04-12T07:03:33+00:00

Relatório de pesquisa da Western Securities aponta que o processo de comercialização de grandes modelos de IA atingiu uma mudança qualitativa, com empresas como Zhipu e MiniMax apresentando um aumento explosivo no consumo de tokens pagos, e um crescimento evidente de usuários. A aplicação de grandes modelos está gradualmente formando um ciclo virtuoso de "aumento de quantidade e preço", além de os fabricantes controlarem o poder de definição de preços em cenários-chave. Além disso, o lançamento do Harness Engineering e a divulgação de código do Claude Code acelerarão a implementação de Agentes de IA. Recomenda-se atenção às empresas Zhipu, MiniMax e outras, com riscos relacionados a mudanças políticas e aumento da concorrência no setor.

MaticHoleFiller

2026-04-12 07:03:33

Geração de resumo em curso

A Western Securities publicou um relatório de pesquisa afirmando que o processo de comercialização de grandes modelos de IA atingiu uma transformação qualitativa de “de 1 a 10”, com fabricantes nacionais de modelos líderes representados por Zhipu(02513) e MiniMax-W(00100) apresentando um aumento exponencial no consumo de tokens pagos e ARR, especialmente em cenários centrais como Codificação de IA, com crescimento rápido de usuários. A aplicação de grandes modelos está formando progressivamente um ciclo virtuoso de “aumento de quantidade e preço”, cuja valoração comercial é validada pelo mercado, e os fabricantes de grandes modelos detêm o controle do preço em cenários essenciais como programação. Quanto à engenharia de IA, a emergência do novo conceito HarnessEngineering e a abertura passiva do Claude Code podem acelerar a implantação em larga escala de aplicações de agentes.

Os principais pontos da Western Securities são os seguintes:

O consumo de tokens pagos de Zhipu atingiu uma evolução exponencial, com ARR da API da plataforma aberta em março atingindo 1,7 bilhão de yuans

Zhipu divulgou o relatório de resultados de 2025: em 2025, a receita da empresa foi de 724 milhões de yuans, aumento de 131,9% ano a ano; prejuízo líquido ajustado de 3,182 bilhões de yuans, aumento de 29,1% em relação ao ano anterior. A estrutura de receita da empresa mudou, com uma grande elevação na proporção de receita de API MaaS. Em 2025, considerando os negócios, a receita da plataforma aberta e API atingiu 190 milhões de yuans, aumento de 292,6% ano a ano; a receita de agentes inteligentes corporativos cresceu 248,8%, chegando a 166 milhões de yuans; a receita de grandes modelos universais para empresas cresceu 70,5%, atingindo 366 milhões de yuans.

O número de desenvolvedores pagos do Zhipu GLM CodingPlan ultrapassou 242 mil, e a empresa aumentou o preço em 30% em fevereiro de 2026, além de cancelar o desconto de primeira compra, entrando em uma nova fase de “aumento de quantidade e preço” de tokens. Além disso, lançou o AutoClaw com instalação de um clique e, em março de 2026, lançou o Claw Plan, que atingiu 100 mil assinantes em apenas dois dias após o lançamento, e 400 mil em 20 dias.

Após o relatório financeiro, a empresa divulgou um dado em tempo real: até 31 de março de 2026, o ARR da API da plataforma aberta atingiu aproximadamente 1,7 bilhão de yuans (( cerca de 250 milhões de dólares), um aumento de mais de 2,4 vezes em relação aos cerca de 500 milhões de yuans no final de 2025, e cerca de 60 vezes maior do que há 12 meses.

Anteriormente, a Minimax também anunciou que seu ARR de fevereiro ultrapassou 150 milhões de dólares. Em 2025, a receita da MiniMax foi de 79,04 milhões de dólares, um aumento de 159% ano a ano. E o crescimento no início de 2026 acelerou ainda mais — o ARR de fevereiro já ultrapassou 150 milhões de dólares, com uma taxa de receita próxima ao dobro do ano passado. O fator direto por trás dessa mudança foi o aumento do uso após o lançamento do modelo M2.5: a média diária de consumo de tokens do modelo de texto da série M2 em fevereiro cresceu mais de 6 vezes em relação a dezembro do ano anterior, e o cenário de programação cresceu mais de 10 vezes.

A consolidação do novo paradigma Harness Engineering está se tornando uma infraestrutura fundamental para a implementação em larga escala de agentes de IA

Em fevereiro de 2026, a OpenAI publicou um blog técnico intitulado “Harness Engineering: Leveraging Codex in an Agent-First World”. O artigo revelou um experimento: uma equipe de apenas 3 engenheiros) expandida para 7 pessoas( gerou mais de 1 milhão de linhas de código de produção usando CodexAgent em cinco meses, fundindo cerca de 1.5 mil Pull Requests, sem uma única linha de código escrita por humanos. Mas o que realmente provocou discussão na indústria não foi o número “100 milhões de linhas de código geradas por IA”, e sim a proposta de um novo paradigma de engenharia: HarnessEngineering) conduzindo a engenharia(.

Harness Engineering é uma abordagem unificada de sistema operacional e metodologia de engenharia de software na era da IA, incluindo o paradigma de agentes com memória, prompts de sistema, bases de conhecimento, orquestração, etc., bem como o fluxo de texto no paradigma OpenClaw, como Agent.md, Soul.md, User.md, etc., tudo voltado para uma melhor interação com os modelos.

A Anthropic também publicou um artigo de blog intitulado “Harness design for long-running application development”, que explica que Harness é uma estrutura externa, sistema de controle e orquestração que sustenta a operação de agentes de IA complexos) Agent(. Não é uma única algoritmo, mas um conjunto completo de “andaimes” de engenharia para gerenciar e ampliar as capacidades de IA. O prompt determina a qualidade de uma única interação, enquanto Harness define o fluxo de execução e a confiabilidade de múltiplas rodadas, múltiplos agentes e tarefas de longa duração.

A função central do Harness é resolver o problema de “perda de controle” da IA ao realizar tarefas complexas e demoradas) Go off the rails(, compensando as limitações internas do modelo por mecanismos externos) como ansiedade de contexto, autoengrandecimento(. Tanto a OpenAI quanto a Anthropic reconhecem que Harness é a infraestrutura-chave para a implementação de agentes de codificação.

Claude Code com mais de 510 mil linhas de código-fonte vazado, com potencial para impulsionar ainda mais a popularização e o desenvolvimento de agentes

Em 31 de março, a Anthropic, devido a um erro na embalagem de pacote npm, teve cerca de 512 mil linhas de código-fonte do Claude Code vazadas, incluindo 4756 arquivos fonte, mais de 40 módulos de ferramentas e funcionalidades não lançadas, sendo “aberta” passivamente ao desenvolvedor global. O código foi divulgado por um pesquisador, sem envolver pesos do modelo ou dados de usuários, mas expondo a arquitetura, prompts e mecanismos de chamada de ferramentas, além de funcionalidades não públicas como processos persistentes Kairos e modo infiltrado, oferecendo a visão mais completa até agora da arquitetura do Claude Code. Este foi um erro semelhante ao anterior da empresa, levantando dúvidas sobre a segurança da cadeia de suprimentos. O código se espalhou na comunidade, e embora a empresa tenha removido os arquivos relacionados, isso reduz significativamente a barreira para o desenvolvimento de agentes de IA, podendo acelerar a competição e inovação tecnológica no setor.

A indústria de grandes modelos de IA está acelerando sua transição de exploração tecnológica para implementação comercial em escala

Primeiro, o processo de comercialização atingiu uma transformação qualitativa de “de 1 a 10”. Fabricantes líderes como Zhipu e MiniMax apresentam um aumento exponencial no consumo de tokens pagos e ARR, especialmente em cenários centrais como Codificação de IA, com crescimento rápido de usuários. Mais importante, a aplicação de grandes modelos está formando um ciclo virtuoso de “aumento de quantidade e preço” — empresas aumentam preços e os usuários aceitam, marcando a transição de grandes modelos de uma ferramenta “usável” para uma infraestrutura de produtividade “necessária”, cuja valoração de mercado é validada, e os fabricantes detêm o controle do preço em cenários essenciais como programação. Quanto à engenharia de IA, a emergência do novo conceito HarnessEngineering e a abertura do Claude Code podem acelerar a implantação em larga escala de aplicações de agentes.

Em relação às ações

Recomenda-se atenção a: Zhipu)02513(, MiniMax-W)00100(, Wangsu Technology)300017.SZ(, Zhuoyi Information)688258.SH(, Cambrian)688256.SH(, Haiguang Information)688041.SH(, Sugon)603019.SH(, Huafeng Technology)688629.SH(.

Avisos de risco

Mudanças na política industrial, progresso tecnológico abaixo do esperado, desenvolvimento de IA abaixo do esperado, aumento da concorrência no setor, mudanças no ambiente internacional.

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.