“Token”economics: a IA precisa de uma nova contabilidade

A bolsa só se faz a ver os relatórios dos analistas do Jin Qilin: autoridade, profissionalismo, atempado, completo — ajude-o a descobrir oportunidades e temas com potencial!

Fonte: Beijing Business Daily

“O Token” está a tornar-se a palavra mais quente na área da IA. Na recente edição de 2026 do Fórum Zhongguancun, as conversas não escaparam ao tema. No evento, o fundador e CEO da Kimi, Yang Zhuilin, e o CEO da Zhipu, Zhang Peng, não deixaram de o abordar. Yang Zhuilin definiu Token como o PIB do futuro, enquanto Zhang Peng foi direto ao dizer que “a concorrência de longo prazo baseada em preços baixos não é favorável ao desenvolvimento da indústria”. Mais de mil quilómetros de distância, o vice-presidente executivo sénior da Tencent, Tang Daosheng, e o vice-presidente Li Qiang também falaram sobre Token: o primeiro afirmou que “com a mesma capacidade de modelo, diferentes designs de Harness (andaime) fazem com que os custos do Token sejam muito diferentes”; o segundo considerou que a mudança de Token é fácil, a adesão é fraca e, quando os subsídios param, os clientes perdem-se com facilidade. Quando a comunidade OpenClaw (apelido dos netizens “lagosta”) promoveu uma explosão exponencial do consumo de Token, o Token deixou de ser apenas um termo técnico e passou a ser uma variável-chave ligada ao modelo de negócio.

“Queimar” custos de Token

A vaga de agentes inteligentes lançada pela lagosta fez o consumo de Token explodir exponencialmente. O que é Token? A definição do National Data Bureau é a menor unidade para modelos grandes de IA processarem informação; Token pode ser medido, precificado e negociável.

Zhang Ting, responsável pelo produto da plataforma Baidu Qianfan, explicou ao repórter do Beijing Business Daily: “Não é exatamente uma única letra, nem exatamente uma palavra; é algo entre as duas, uma espécie de ‘fragmento de linguagem’. Por exemplo, o carácter chinês ‘我’ é um Token; ‘hoje’ pode ser um Token, mas ‘internacionalização’ pode ser dividido em ‘internacional’ e ‘ização’ — dois Tokens. Como a linguagem que os grandes modelos enfrentam é global, Token é uma espécie de ‘maior denominador comum’ universal, permitindo que o modelo trate todas as línguas e símbolos de forma unificada”.

Segundo informações do National Data Bureau, no início de 2024, o volume diário de chamadas de Token na China era de 100 mil milhões; até ao final de 2025, subiu para 100 triliões; em março de 2026, já ultrapassou 140 triliões, com crescimento superior a mil vezes em dois anos.

A reação das empresas de cloud e das empresas de modelos grandes de IA começou em fevereiro: a Zhipu cancelou o desconto na primeira compra do GLM Coding Plan, com aumentos globais de preço dos pacotes a partir de 30%. No início de março, a Tencent Cloud já tinha aumentado o preço de dois modelos desenvolvidos internamente; no modelo Tencent HY2.0 Instruct, a subida chegou a 463%. No fim do mês, a Alibaba Cloud e a Baidu Intelligent Cloud anunciaram no mesmo dia a subida dos preços da capacidade de computação de IA, com um aumento máximo de 34%.

Quanto à lógica que liga a explosão dos agentes inteligentes ao crescimento do consumo de Token, Zhang Peng explicou recentemente de forma detalhada: “Ao enfrentar tarefas complexas, a cadeia de raciocínio do modelo é longa; o consumo de Token é muito elevado e, por isso, os custos de inferência do modelo aumentam em conformidade. Assim, o preço do Token deve voltar ao seu valor comercial normal. Concorrer a longo prazo com base em preços baixos também não é favorável ao desenvolvimento de toda a indústria.”

Numa entrevista ao repórter do Beijing Business Daily e a outros meios de comunicação social, Li Qiang afirmou: “A economia do Token vai ser rapidamente observada por todos os clientes. Se apenas considerarem o volume de consumo e não a economia, o preço ou o custo no lado do utilizador poderá ser mais alto; isso terá efeitos negativos no desenvolvimento a longo prazo e saudável da empresa”.

Harness “andaimes” por baixo da superfície

Como é que o Token é, afinal, precificado? Zhang Ting desagregou o assunto com um exemplo ao repórter do Beijing Business Daily: “Por exemplo, ‘como está o tempo em Pequim hoje’, juntando a resposta da IA, pode consumir cerca de 50 a 100 Tokens. Se você mandar a IA escrever um ensaio de 800 palavras, somando os seus prompts e a saída completa, pode consumir cerca de 1000 a 1500 Tokens”. “Convertendo em dinheiro: atualmente, na plataforma Baidu Qianfan, os preços dos modelos principais estão na ordem de alguns cêntimos por cada milhão de Tokens. Ou seja, 1 yuan permite que a IA escreva cerca de 1000 ensaios de 800 palavras”. Zhang Ting disse.

Mas quando o consumo de Token cresce de forma exponencial, surge uma questão ainda mais profunda: nem todos esses Tokens são gastos no que é “a faca e o cabo”. “Token é como gasolina e Agent como o motor do carro. Se só se preocupar com o consumo de combustível e não com a economia do motor e a capacidade de saída, o cliente acaba por desistir.” Li Qiang explicou a eficiência do Token usando o consumo de combustível.

Li Di, fundador da Nextie (Amanhã Novo Percurso) e “o pai do Xiaobing”, também disse ao repórter do Beijing Business Daily: “O calor do consumo de Token aponta para um fenómeno interessante: Tokenmaxxing (isto é, um campeonato de ‘esfregar’ Token com volume). Atualmente, muitos programadores e empresas estão a fazer uma enorme ‘queima’ de alto consumo de Token, chegando a tratá-lo como uma demonstração de ‘músculo de capacidade de computação’. Mas essa combustão sem limites traz um enorme desequilíbrio no ROI (retorno sobre investimento)”.

Com este pano de fundo, outro conceito, Harness, ganhou rapidamente popularidade tanto no Vale do Silício como nos círculos técnicos domésticos.

Li Di explicou em detalhe ao repórter do Beijing Business Daily que a tradução literal de Harness é “arreios” ou “rédeas”. Se o grande modelo for como um cavalo selvagem, com força imensa mas direção incerta, Harness é o sistema de restrições capaz de o fazer correr dentro de um percurso definido.

“Colocar a IA em prática não é só um problema de algoritmo, é também um problema de engenharia”, Tang Daosheng lançou esta avaliação. “Com a mesma capacidade de modelo, diferentes designs de andaimes ou Harness — por exemplo, que ferramentas chamar ao modelo, engenharia de contexto por camadas, gestão de memória longa, implementação de workflo ws — têm um grande impacto no efeito real de uso e nos custos de Token.”

O responsável por modelos grandes da Xiaomi MiMo, Luo Fuli, ao interpretar o valor de OpenClaw, também mencionou este termo: “O OpenClaw eleva muito o teto dos modelos ‘código-fechado’ domésticos desses níveis. Ao mesmo tempo, pode garantir a completude e a precisão na execução das tarefas do modelo através de uma série de designs como uma Harness (sistema de controlo de restrições), garantindo bem o valor mínimo”.

Empresas de cloud a reconstruir “a base”

Em termos concretos de engenharia, a plataforma de desenvolvimento de agentes inteligentes da Tencent Cloud, ADP, liga os agentes a “uma biblioteca” através de capacidades como RAG (geração aumentada por recuperação) e bases de conhecimento, mantendo especialistas do setor sempre online. Depois vem o Claw a correr em sandbox de segurança do Agent Runtime: o Claw, como centro nervoso do sistema inteligente, encontra e descarrega Skills a partir da base de skills, aprende continuamente e vai acumulando capacidades para conectar-se a sistemas externos. Com a ajuda do grande modelo, envia e recebe instruções para o exterior, desencadeando ações. A sandbox do AgentRuntime também pode ser usada para validar os resultados de programas de aprendizagem por reforço de grandes modelos, melhorando a eficiência do treino da aprendizagem por reforço.

Isto é apenas uma ponta do iceberg das infraestruturas.

“Talvez o fim da capacidade de computação seja a eletricidade.” Li Qiang revelou na entrevista que a Tencent começou há dois anos a explorar a colaboração entre computação e energia. “Com parceiros, na Região Autónoma da Mongólia Interior, utilizamos a energia eólica e a energia de armazenamento com luz local para fornecer diretamente eletricidade aos centros de dados, combinando picos e vales de energia limpa com a energia de hidrogénio e armazenamento de energia, ao mesmo tempo que coordenamos os picos e vales do período de capacidade de computação. Por um lado, reduzimos significativamente o custo da eletricidade; por outro, reduzimos as emissões de carbono.”

Outra camada de mudança acontece no mecanismo de escalonamento e despacho. “Atualmente, a infraestrutura da era da computação em nuvem foi desenhada para servir engenheiros humanos, e não para servir IA. A longo prazo, a infraestrutura deve ser um conjunto: todo este conjunto deve ser capaz de evoluir e iterar-se, formando uma organização autónoma. É como se todo o conjunto de infraestrutura fosse gerido por um CEO reconhecido; pode ser um Claw, que iteraria de forma autónoma a sua infraestrutura, de acordo com as necessidades dos clientes de IA”, explicou Xia Lixue, cofundador e CEO da Wu Wen Xin Qiong.

Atenção especial deve ser dada ao facto de que, atualmente, os principais fornecedores de cloud têm uma dupla identidade: a Alibaba Cloud, a Tencent Cloud e a Baidu Intelligent Cloud são tanto fornecedores de Token como consumidores de Token.

De acordo com as metas recentemente divulgadas pela Alibaba Cloud, nos próximos cinco anos, a receita anual de comercialização de cloud e de IA ultrapassará 100 mil milhões de dólares. Ao mesmo tempo, o Grupo Alibaba disponibiliza quotas de Token aos funcionários, incentivando-os a usar, no trabalho, modelos e ferramentas avançadas de IA.

Li Qiang afirmou: “O Token certamente é um dos indicadores de gestão muito importantes da Tencent Cloud. Mas não o colocaram na mais alta prioridade, e também não avançaram com políticas extremas de recompensa para o impulsionar. A Tencent prefere concentrar-se no desenvolvimento de um motor melhor, criando consumo real de Token através de produtos de IA úteis. Em 2025, a Tencent Cloud atingiu lucros em escala; ‘em 2026, não queremos ser demasiado agressivos’”, disse Li Qiang de forma direta.

Com o impacto de 140 triliões de Tokens na indústria, já começou mais uma ronda de competição.

Repórter do Beijing Business Daily: Wei Wei

		Declaração da Sina: Esta notícia foi republicada a partir de um meio de comunicação social parceiro da Sina; a Sina publicou este artigo com o objetivo de transmitir mais informação, e não significa que concorde com as suas opiniões nem que comprove a veracidade das descrições. O conteúdo do artigo é apenas para referência e não constitui aconselhamento de investimento. Os investidores devem operar por sua conta e risco.

Muita informação, interpretação precisa — tudo na app de finanças da Sina

责任编辑:高佳

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar