Tokens estão em alta! Um artigo para entender a cadeia de valor da economia de tokens

“Token é a nova mercadoria.” Na Conferência de Desenvolvedores GTC 2026 da Nvidia, o fundador e CEO da Nvidia, Jensen Huang, apresentou pela primeira vez a economia dos tokens.

Jensen Huang propôs uma fórmula: receita = número de tokens por watt × capacidade disponível em gigawatts. Ele explicou que os data centers tornaram-se agora “fábricas de tokens” que funcionam 24 horas por dia, recebendo energia e dados e produzindo tokens. A receita de uma “fábrica” depende do produto da eficiência e da escala da produção de tokens.

O diretor do Escritório Nacional de Estatísticas da China, Liu Liehong, afirmou recentemente que, até março deste ano, o volume diário de chamadas de tokens na China ultrapassou 140 trilhões, um aumento de mais de 1000 vezes em relação aos 100 bilhões registrados no início de 2024.

A economia dos tokens, uma nova cadeia industrial, está emergindo.

O que é a economia dos tokens

Token é a unidade básica de processamento de informação em grandes modelos. Quando um usuário faz uma pergunta a um modelo de IA, o modelo primeiro divide as palavras do usuário em tokens e, após o processamento, reconstrói o resultado em frases. Cada token gerado implica, na verdade, o uso da capacidade computacional das GPUs do data center, acompanhado de consumo de energia.

Portanto, token é uma unidade de medição por natureza. As APIs dos fornecedores de grandes modelos cobram por tokens, e os prestadores de serviços em nuvem precificam a capacidade computacional por tokens, assim como “graus” são para a eletricidade.

No entanto, por um período considerável, tokens eram apenas um conceito de custo. De 2023 a 2024, as empresas de modelos competiam em termos de escala de parâmetros e volume de dados de treinamento, e tokens eram vistos como custos, com ninguém os considerando como “produtos”.

A mudança ocorreu após a IA entrar na fase de inferência. Nos últimos dois anos, a IA foi amplamente implementada em cenários comerciais, e cada interação do usuário e execução de tarefas continua a consumir tokens. No modelo de cobrança, muitas empresas de IA cobram dos usuários com base na quantidade de tokens utilizados; quanto mais se consome, mais se vende. Assim, tokens tornaram-se uma mercadoria que pode ser produzida em massa, precificada de forma escalonada e negociada em larga escala.

Na GTC 2026, Jensen Huang apresentou pela primeira vez a economia dos tokens, dizendo: “Tokens são a nova mercadoria.” Em sua descrição, os data centers funcionam como fábricas de tokens que operam ininterruptamente, com dados e eletricidade como matérias-primas e tokens como produtos.

Ele apresentou um novo indicador, “número de tokens por watt” (Tokens per Watt), argumentando que isso medirá a capacidade de receita dos futuros data centers. Isso porque “com um limite de potência fixo, quem tiver a maior taxa de produção de tokens por watt terá o menor custo de produção.” A iteração tecnológica da Nvidia sempre se concentrou na eficiência da produção de tokens.

Em resumo, a essência da economia dos tokens é quantificar, precificar e negociar a produção inteligente da IA como se fossem produtos industriais.

A economia dos tokens está se concretizando. O CEO da OpenAI, Sam Altman, disse em uma apresentação no início deste ano: “Fundamentalmente, nossos negócios, assim como os de todos os fornecedores de modelos de IA, vão se transformar essencialmente em vender tokens.”

O diretor do Escritório Nacional de Estatísticas da China, Liu Liehong, afirmou recentemente que, até março deste ano, o volume diário de chamadas de tokens na China ultrapassou 140 trilhões, um aumento de mais de 1000 vezes em relação aos 100 bilhões registrados no início de 2024, e um aumento de mais de 40% em relação aos 100 trilhões de tokens estimados para o final de 2025.

Liu Liehong acredita que os tokens não são apenas um ponto de ancoragem de valor na era da inteligência, mas também uma “unidade de liquidação” que conecta a oferta tecnológica à demanda comercial, proporcionando uma possibilidade quantificável para a implementação de modelos de negócios.

Cadeia industrial da “fábrica de tokens”

“Uma nova revolução industrial está em curso: o que entra na fábrica (data center) são dados e eletricidade, e o que sai são tokens.” disse Jensen Huang.

Uma “fábrica de tokens”, assim como uma fábrica de manufatura, precisa de instalações, equipamentos, logística e vendas. Seguindo essa lógica e combinando relatórios de múltiplas corretoras, a economia dos tokens pode ser dividida em quatro etapas.

#1

Etapa de produção

Setores envolvidos: chips de IA e servidores, infraestrutura de AIDC (centros de dados de IA), resfriamento líquido, sistemas de fornecimento de energia.

O processo de produção de tokens é o mesmo que o processo de inferência, convertendo eletricidade e dados em tokens. O limite de capacidade de um data center é determinado pelo seu hardware físico, incluindo salas de AIDC, chips de IA, servidores, sistemas de resfriamento líquido e instalações de fornecimento de energia. Eles determinam em conjunto a eficiência de utilização da potência, ou seja, quantos tokens podem ser gerados por cada watt de energia.

Jensen Huang mencionou: “Uma fábrica de 1 gigawatt nunca se tornará 2 gigawatts, isso é uma lei física.” Isso significa que a competição na etapa de produção é, essencialmente, uma disputa de eficiência; com a mesma quantidade de eletricidade, quem pode produzir mais tokens terá mais vantagens.

#2

Etapa de otimização

Setores envolvidos: algoritmos de otimização de inferência, sistemas de programação, módulos ópticos, etc.

Uma vez que o data center é construído, a potência total é fixa. Com hardware imutável, o principal meio de aumentar a receita é fazer com que cada watt de eletricidade produza mais tokens contabilizáveis.

Jensen Huang mencionou um exemplo na GTC 2026: as empresas Fireworks AI e Lynn, sem trocar nenhum hardware, apenas com a atualização do software e dos algoritmos de inferência da Nvidia, aumentaram a velocidade de geração de tokens de cerca de 700 por segundo para quase 5000. Isso significa que algoritmos de programação, otimização de inferência e outras tecnologias podem aumentar significativamente a produção da fábrica sem a necessidade de adicionar hardware.

#3

Etapa de circulação

Setores envolvidos: CDN (rede de distribuição de conteúdo), redes privadas transfronteiriças, cabos submarinos.

Após a produção, os tokens precisam ser entregues aos usuários finais com latência extremamente baixa. Diferentemente dos produtos físicos, a produção e a entrega de tokens muitas vezes ocorrem simultaneamente.

Os nós de borda da CDN (rede de distribuição de conteúdo) assumem o papel de entrega da “última milha”, enquanto, quando os tokens precisam ser entregues internacionalmente, redes privadas transfronteiriças e cabos submarinos constituem os canais de logística internacional.

A “exportação de tokens” também ocorre nesta etapa. Modelos nacionais, com vantagens significativas em custos de inferência, estão exportando tokens em larga escala através de plataformas de API no exterior, sustentando a infraestrutura de rede para o fluxo transfronteiriço como base para a exportação.

#4

Etapa de aplicação

Setores envolvidos: fornecedores de grandes modelos, aplicações de agentes, SaaS de setores verticais, plataformas de geração multimodal.

A etapa de aplicação é também a etapa final de realização de valor da economia dos tokens. Jensen Huang previu na GTC 2026 que no futuro, cada empresa de SaaS se tornará uma empresa de Agent-as-a-Service (serviço de agentes), e cada engenheiro terá um orçamento anual de tokens.

À medida que as aplicações de IA continuam a se concretizar, os cenários de consumo de tokens irão além do atual AI conversacional, expandindo-se para agentes, geração de conteúdo multimodal, análise financeira e outros aspectos. Quanto maior o consumo, mais se cria uma demanda de expansão para a produção upstream, formando um ciclo positivo, que é a roda motriz contínua de toda a cadeia industrial.

Foco em infraestrutura de capacidade computacional e outras direções de investimento

O relatório da Great Wall Securities acredita que o OpenClaw representa um novo ponto de aceleração robusto para a IA, e a velocidade de queima de tokens aumentará drasticamente. Nesse modelo, o consumo de tokens crescerá várias vezes, até dezenas de vezes.

Do ponto de vista do investimento, o rápido desenvolvimento da economia dos tokens beneficiará primeiro a etapa de produção das fábricas de tokens, incluindo chips de IA, data centers, resfriamento líquido, fornecimento de energia e outras infraestruturas de capacidade computacional, que é também a direção com maior consenso entre as instituições atualmente.

O relatório da CITIC Securities mostra que o consumo de tokens da ByteDance dobra aproximadamente a cada três meses, e quando as grandes empresas de nuvem na China atingirem um consumo diário de 60 trilhões de tokens, enfrentarão uma clara escassez de capacidade computacional. Portanto, espera-se que as grandes empresas de nuvem na China sintam a pressão de capacidade quando o consumo diário de tokens atingir 30 trilhões, e que comece a haver uma escassez de capacidade ao atingir 60 trilhões de tokens.

O analista-chefe do setor de telecomunicações da Open Source Securities, Jiang Ying, acredita que tokens = chips de IA (capacidade computacional nacional + aluguel de capacidade computacional) = AIDC. O relatório da Guojin Securities afirma que a cadeia industrial de capacidade computacional entrará em um ciclo de “inflação em toda a cadeia” em 2026, com a prosperidade se espalhando dos chips para AIDC, serviços em nuvem e equipamentos elétricos.

Além disso, o aluguel de capacidade computacional e a exportação de tokens também são direções que se beneficiam da popularidade da economia dos tokens.

A Great Wall Securities acredita que a essência da exportação de tokens é que modelos de IA locais oferecem serviços de inferência globalmente através de interfaces de API, cobrando com base no volume de processamento, realizando assim a “exportação digital” de capacidade computacional e elétrica. A razão pela qual os grandes modelos da China podem rapidamente conquistar participação de mercado global é a vantagem central em controle de custos, especialmente na parte elétrica.

De acordo com os cálculos da equipe de computação da Shenwan Hongyuan, o custo de inferência dos modelos de IA nacionais é apenas de um sexto a um décimo do custo no exterior.

“A cadeia industrial dos tokens é essencialmente uma transformação que converte a eletricidade do mundo físico em inteligência do mundo digital”, acredita a Great Wall Securities. A lógica de aumento de preços dessa cadeia industrial segue o caminho de “explosão da demanda internacional → escassez de hardware de armazenamento e computação → gargalos de energia/investimento em infraestrutura → reavaliação de custos em toda a cadeia”. A eletricidade verde e a transmissão de ultra-alta tensão que possuem vantagens de custo na parte upstream constituem a base de custo, garantindo o limite inferior da margem bruta; a capacidade de armazenamento e computação no meio da cadeia representa o gargalo crucial da capacidade de oferta; os modelos e a camada de otimização na parte inferior da cadeia obtêm um prêmio tecnológico através da otimização de algoritmos; e as aplicações e a camada de exportação na parte mais baixa aproveitam a alta disposição de pagamento global para abrir o limite superior de lucro.

A Great Wall Securities acredita que, do ponto de vista do investimento, a prioridade pode ser dividida em várias etapas. A primeira etapa é o armazenamento e a memória, para obter o maior potencial de aumento de preços proveniente da desajustação de oferta e demanda no curto prazo; a segunda etapa é chips de capacidade computacional e servidores, para garantir o desempenho de médio prazo; a terceira etapa é equipamentos elétricos e operação de eletricidade verde, que têm barreiras de longo prazo; e a quarta etapa são as principais empresas com capacidade de implementação em cenários reais e capacidade de monetização a preços elevados no exterior.

(Fonte: China Securities Journal)

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar