O custo efetivo por token tornar-se-á um indicador-chave de competição na indústria de poder computacional

robot
Geração de resumo em curso

Relator do Securities Times, Guo Bohao

“A infraestrutura de computação que sustenta o desenvolvimento da inteligência artificial (IA) está gradualmente passando de uma ‘fábrica de poder de processamento’ para uma ‘fábrica de tokens (Token)’. ” Na reunião anual do Fórum Zhongguancun 2026, o vice-presidente sênior da Sugon, Li Bin, fez essa avaliação, apontando a transformação lógica fundamental que está ocorrendo na indústria de poder de processamento de IA.

À medida que o processo de comercialização da indústria de IA acelera, os critérios de competição no setor estão mudando. De uma competição baseada na escala de hardware de poder de processamento, para uma disputa mais refinada de eficiência de uso do poder de processamento e capacidade de fornecimento eficaz de tokens. Como maximizar a produção de tokens de alta qualidade por unidade de poder de processamento tornou-se uma questão-chave para determinar o futuro do setor.

Recentemente, a popularidade fenomenal de agentes inteligentes de IA representados pelo OpenClaw (conhecido como “Lagosta”) impulsionou diretamente uma expansão exponencial na demanda global por tokens. Dados da plataforma de agregação de modelos de IA de terceiros, OpenRouter, mostram que, na semana de 9 a 15 de março de 2026, uma única instância de OpenClaw contribuiu com 20% do consumo de tokens na plataforma; seu consumo semanal de tokens já equivale a 60% do consumo médio semanal de tokens de toda a plataforma no quarto trimestre de 2025.

A implementação em larga escala de agentes inteligentes de IA está reescrevendo a curva de crescimento da demanda por tokens e também impondo novos requisitos à capacidade de fornecimento de infraestrutura de computação. Como afirmou Ao Yulong, chefe de desenvolvimento do quadro de IA do Instituto de Pesquisa em Inteligência Artificial de Zhiyuan, em Pequim, a indústria de IA está passando de uma fase de “fornecimento de poder de processamento” para uma de “fornecimento eficaz de tokens”, e no futuro, o custo de tokens eficazes será um indicador-chave de competitividade na indústria de poder de processamento.

He Shuibing, vice-líder do laboratório Zhijiang, afirmou que a expansão da escala de poder de processamento não equivale a uma melhoria sincronizada na capacidade de produção de tokens. Problemas como gargalos de agendamento, limitações de comunicação e desempenho de armazenamento podem afetar a eficiência de liberação do poder de processamento, reduzindo a eficiência de produção de tokens por unidade de poder. “Por exemplo, um cluster de milhões de cartões H100 tem um custo anual de cerca de 1,2 bilhão de yuans. Se a eficiência de uso do poder de processamento diminuir 10%, a perda econômica direta anual ultrapassará 120 milhões de yuans”, exemplificou He Shuibing.

Para enfrentar os principais desafios do setor, vários especialistas acreditam que a inovação na arquitetura, representada por supernós, é uma estratégia importante para melhorar a eficiência do poder de processamento e transformar esse poder em tokens de alta eficiência. Os supernós, por meio de uma arquitetura de conexão ultrarrápida, convertem clusters distribuídos em grandes máquinas de um só dispositivo, resolvendo fundamentalmente os gargalos de comunicação das arquiteturas tradicionais de poder de processamento e elevando a eficiência de uso do poder de processamento a um novo patamar.

Wang Zixiao, responsável pela tecnologia de rede inteligente do Instituto de Pesquisa em Nuvem e Integração de Redes da China Telecom, explicou que, usando produtos de supernós, o desempenho de inferência prática aumentou 2,6 vezes em comparação com a configuração tradicional de 8 cartões, reduzindo diretamente a escala de hardware necessária para produzir a mesma quantidade de tokens. Li Ran, especialista em soluções de IA da Sugon, também afirmou que o novo supernó ScaleX40, lançado recentemente, oferece uma capacidade de processamento de inferência mais de quatro vezes maior em cenários típicos de inferência, em comparação com configurações tradicionais de 8 cartões, podendo aumentar significativamente a produção de tokens por unidade de poder de processamento, apoiando de forma acessível a indústria de IA.

Quanto ao futuro da indústria, os participantes concordaram que, nos próximos 3 a 5 anos, a inovação central será a redução do custo de tokens eficazes. A colaboração profunda entre poder de processamento e aplicações, a otimização de software e hardware de pilha completa, e a ecologia de toda a cadeia industrial serão os principais focos de avanço, promovendo a transformação do setor de hardware para a melhoria do desempenho do sistema, apoiando de forma eficiente a integração profunda da IA com diversos setores econômicos.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar