Futuros
Aceda a centenas de contratos perpétuos
TradFi
Ouro
Plataforma de ativos tradicionais globais
Opções
Hot
Negoceie Opções Vanilla ao estilo europeu
Conta Unificada
Maximize a eficiência do seu capital
Negociação de demonstração
Introdução à negociação de futuros
Prepare-se para a sua negociação de futuros
Eventos de futuros
Participe em eventos para recompensas
Negociação de demonstração
Utilize fundos virtuais para experimentar uma negociação sem riscos
Lançamento
CandyDrop
Recolher doces para ganhar airdrops
Launchpool
Faça staking rapidamente, ganhe potenciais novos tokens
HODLer Airdrop
Detenha GT e obtenha airdrops maciços de graça
Launchpad
Chegue cedo ao próximo grande projeto de tokens
Pontos Alpha
Negoceie ativos on-chain para airdrops
Pontos de futuros
Ganhe pontos de futuros e receba recompensas de airdrop
Investimento
Simple Earn
Ganhe juros com tokens inativos
Investimento automático
Invista automaticamente de forma regular.
Investimento Duplo
Aproveite a volatilidade do mercado
Soft Staking
Ganhe recompensas com staking flexível
Empréstimo de criptomoedas
0 Fees
Dê em garantia uma criptomoeda para pedir outra emprestada
Centro de empréstimos
Centro de empréstimos integrado
Tokens estão em alta! Um artigo para entender a cadeia de valor da economia de tokens
“Token é a nova mercadoria.” Na Conferência de Desenvolvedores GTC 2026 da Nvidia, o fundador e CEO da Nvidia, Jensen Huang, apresentou pela primeira vez a economia dos tokens.
Jensen Huang propôs uma fórmula: receita = número de tokens por watt × capacidade disponível em gigawatts. Ele explicou que os data centers tornaram-se agora “fábricas de tokens” que funcionam 24 horas por dia, recebendo energia e dados e produzindo tokens. A receita de uma “fábrica” depende do produto da eficiência e da escala da produção de tokens.
O diretor do Escritório Nacional de Estatísticas da China, Liu Liehong, afirmou recentemente que, até março deste ano, o volume diário de chamadas de tokens na China ultrapassou 140 trilhões, um aumento de mais de 1000 vezes em relação aos 100 bilhões registrados no início de 2024.
A economia dos tokens, uma nova cadeia industrial, está emergindo.
O que é a economia dos tokens
Token é a unidade básica de processamento de informação em grandes modelos. Quando um usuário faz uma pergunta a um modelo de IA, o modelo primeiro divide as palavras do usuário em tokens e, após o processamento, reconstrói o resultado em frases. Cada token gerado implica, na verdade, o uso da capacidade computacional das GPUs do data center, acompanhado de consumo de energia.
Portanto, token é uma unidade de medição por natureza. As APIs dos fornecedores de grandes modelos cobram por tokens, e os prestadores de serviços em nuvem precificam a capacidade computacional por tokens, assim como “graus” são para a eletricidade.
No entanto, por um período considerável, tokens eram apenas um conceito de custo. De 2023 a 2024, as empresas de modelos competiam em termos de escala de parâmetros e volume de dados de treinamento, e tokens eram vistos como custos, com ninguém os considerando como “produtos”.
A mudança ocorreu após a IA entrar na fase de inferência. Nos últimos dois anos, a IA foi amplamente implementada em cenários comerciais, e cada interação do usuário e execução de tarefas continua a consumir tokens. No modelo de cobrança, muitas empresas de IA cobram dos usuários com base na quantidade de tokens utilizados; quanto mais se consome, mais se vende. Assim, tokens tornaram-se uma mercadoria que pode ser produzida em massa, precificada de forma escalonada e negociada em larga escala.
Na GTC 2026, Jensen Huang apresentou pela primeira vez a economia dos tokens, dizendo: “Tokens são a nova mercadoria.” Em sua descrição, os data centers funcionam como fábricas de tokens que operam ininterruptamente, com dados e eletricidade como matérias-primas e tokens como produtos.
Ele apresentou um novo indicador, “número de tokens por watt” (Tokens per Watt), argumentando que isso medirá a capacidade de receita dos futuros data centers. Isso porque “com um limite de potência fixo, quem tiver a maior taxa de produção de tokens por watt terá o menor custo de produção.” A iteração tecnológica da Nvidia sempre se concentrou na eficiência da produção de tokens.
Em resumo, a essência da economia dos tokens é quantificar, precificar e negociar a produção inteligente da IA como se fossem produtos industriais.
A economia dos tokens está se concretizando. O CEO da OpenAI, Sam Altman, disse em uma apresentação no início deste ano: “Fundamentalmente, nossos negócios, assim como os de todos os fornecedores de modelos de IA, vão se transformar essencialmente em vender tokens.”
O diretor do Escritório Nacional de Estatísticas da China, Liu Liehong, afirmou recentemente que, até março deste ano, o volume diário de chamadas de tokens na China ultrapassou 140 trilhões, um aumento de mais de 1000 vezes em relação aos 100 bilhões registrados no início de 2024, e um aumento de mais de 40% em relação aos 100 trilhões de tokens estimados para o final de 2025.
Liu Liehong acredita que os tokens não são apenas um ponto de ancoragem de valor na era da inteligência, mas também uma “unidade de liquidação” que conecta a oferta tecnológica à demanda comercial, proporcionando uma possibilidade quantificável para a implementação de modelos de negócios.
Cadeia industrial da “fábrica de tokens”
“Uma nova revolução industrial está em curso: o que entra na fábrica (data center) são dados e eletricidade, e o que sai são tokens.” disse Jensen Huang.
Uma “fábrica de tokens”, assim como uma fábrica de manufatura, precisa de instalações, equipamentos, logística e vendas. Seguindo essa lógica e combinando relatórios de múltiplas corretoras, a economia dos tokens pode ser dividida em quatro etapas.
#1
Etapa de produção
Setores envolvidos: chips de IA e servidores, infraestrutura de AIDC (centros de dados de IA), resfriamento líquido, sistemas de fornecimento de energia.
O processo de produção de tokens é o mesmo que o processo de inferência, convertendo eletricidade e dados em tokens. O limite de capacidade de um data center é determinado pelo seu hardware físico, incluindo salas de AIDC, chips de IA, servidores, sistemas de resfriamento líquido e instalações de fornecimento de energia. Eles determinam em conjunto a eficiência de utilização da potência, ou seja, quantos tokens podem ser gerados por cada watt de energia.
Jensen Huang mencionou: “Uma fábrica de 1 gigawatt nunca se tornará 2 gigawatts, isso é uma lei física.” Isso significa que a competição na etapa de produção é, essencialmente, uma disputa de eficiência; com a mesma quantidade de eletricidade, quem pode produzir mais tokens terá mais vantagens.
#2
Etapa de otimização
Setores envolvidos: algoritmos de otimização de inferência, sistemas de programação, módulos ópticos, etc.
Uma vez que o data center é construído, a potência total é fixa. Com hardware imutável, o principal meio de aumentar a receita é fazer com que cada watt de eletricidade produza mais tokens contabilizáveis.
Jensen Huang mencionou um exemplo na GTC 2026: as empresas Fireworks AI e Lynn, sem trocar nenhum hardware, apenas com a atualização do software e dos algoritmos de inferência da Nvidia, aumentaram a velocidade de geração de tokens de cerca de 700 por segundo para quase 5000. Isso significa que algoritmos de programação, otimização de inferência e outras tecnologias podem aumentar significativamente a produção da fábrica sem a necessidade de adicionar hardware.
#3
Etapa de circulação
Setores envolvidos: CDN (rede de distribuição de conteúdo), redes privadas transfronteiriças, cabos submarinos.
Após a produção, os tokens precisam ser entregues aos usuários finais com latência extremamente baixa. Diferentemente dos produtos físicos, a produção e a entrega de tokens muitas vezes ocorrem simultaneamente.
Os nós de borda da CDN (rede de distribuição de conteúdo) assumem o papel de entrega da “última milha”, enquanto, quando os tokens precisam ser entregues internacionalmente, redes privadas transfronteiriças e cabos submarinos constituem os canais de logística internacional.
A “exportação de tokens” também ocorre nesta etapa. Modelos nacionais, com vantagens significativas em custos de inferência, estão exportando tokens em larga escala através de plataformas de API no exterior, sustentando a infraestrutura de rede para o fluxo transfronteiriço como base para a exportação.
#4
Etapa de aplicação
Setores envolvidos: fornecedores de grandes modelos, aplicações de agentes, SaaS de setores verticais, plataformas de geração multimodal.
A etapa de aplicação é também a etapa final de realização de valor da economia dos tokens. Jensen Huang previu na GTC 2026 que no futuro, cada empresa de SaaS se tornará uma empresa de Agent-as-a-Service (serviço de agentes), e cada engenheiro terá um orçamento anual de tokens.
À medida que as aplicações de IA continuam a se concretizar, os cenários de consumo de tokens irão além do atual AI conversacional, expandindo-se para agentes, geração de conteúdo multimodal, análise financeira e outros aspectos. Quanto maior o consumo, mais se cria uma demanda de expansão para a produção upstream, formando um ciclo positivo, que é a roda motriz contínua de toda a cadeia industrial.
Foco em infraestrutura de capacidade computacional e outras direções de investimento
O relatório da Great Wall Securities acredita que o OpenClaw representa um novo ponto de aceleração robusto para a IA, e a velocidade de queima de tokens aumentará drasticamente. Nesse modelo, o consumo de tokens crescerá várias vezes, até dezenas de vezes.
Do ponto de vista do investimento, o rápido desenvolvimento da economia dos tokens beneficiará primeiro a etapa de produção das fábricas de tokens, incluindo chips de IA, data centers, resfriamento líquido, fornecimento de energia e outras infraestruturas de capacidade computacional, que é também a direção com maior consenso entre as instituições atualmente.
O relatório da CITIC Securities mostra que o consumo de tokens da ByteDance dobra aproximadamente a cada três meses, e quando as grandes empresas de nuvem na China atingirem um consumo diário de 60 trilhões de tokens, enfrentarão uma clara escassez de capacidade computacional. Portanto, espera-se que as grandes empresas de nuvem na China sintam a pressão de capacidade quando o consumo diário de tokens atingir 30 trilhões, e que comece a haver uma escassez de capacidade ao atingir 60 trilhões de tokens.
O analista-chefe do setor de telecomunicações da Open Source Securities, Jiang Ying, acredita que tokens = chips de IA (capacidade computacional nacional + aluguel de capacidade computacional) = AIDC. O relatório da Guojin Securities afirma que a cadeia industrial de capacidade computacional entrará em um ciclo de “inflação em toda a cadeia” em 2026, com a prosperidade se espalhando dos chips para AIDC, serviços em nuvem e equipamentos elétricos.
Além disso, o aluguel de capacidade computacional e a exportação de tokens também são direções que se beneficiam da popularidade da economia dos tokens.
A Great Wall Securities acredita que a essência da exportação de tokens é que modelos de IA locais oferecem serviços de inferência globalmente através de interfaces de API, cobrando com base no volume de processamento, realizando assim a “exportação digital” de capacidade computacional e elétrica. A razão pela qual os grandes modelos da China podem rapidamente conquistar participação de mercado global é a vantagem central em controle de custos, especialmente na parte elétrica.
De acordo com os cálculos da equipe de computação da Shenwan Hongyuan, o custo de inferência dos modelos de IA nacionais é apenas de um sexto a um décimo do custo no exterior.
“A cadeia industrial dos tokens é essencialmente uma transformação que converte a eletricidade do mundo físico em inteligência do mundo digital”, acredita a Great Wall Securities. A lógica de aumento de preços dessa cadeia industrial segue o caminho de “explosão da demanda internacional → escassez de hardware de armazenamento e computação → gargalos de energia/investimento em infraestrutura → reavaliação de custos em toda a cadeia”. A eletricidade verde e a transmissão de ultra-alta tensão que possuem vantagens de custo na parte upstream constituem a base de custo, garantindo o limite inferior da margem bruta; a capacidade de armazenamento e computação no meio da cadeia representa o gargalo crucial da capacidade de oferta; os modelos e a camada de otimização na parte inferior da cadeia obtêm um prêmio tecnológico através da otimização de algoritmos; e as aplicações e a camada de exportação na parte mais baixa aproveitam a alta disposição de pagamento global para abrir o limite superior de lucro.
A Great Wall Securities acredita que, do ponto de vista do investimento, a prioridade pode ser dividida em várias etapas. A primeira etapa é o armazenamento e a memória, para obter o maior potencial de aumento de preços proveniente da desajustação de oferta e demanda no curto prazo; a segunda etapa é chips de capacidade computacional e servidores, para garantir o desempenho de médio prazo; a terceira etapa é equipamentos elétricos e operação de eletricidade verde, que têm barreiras de longo prazo; e a quarta etapa são as principais empresas com capacidade de implementação em cenários reais e capacidade de monetização a preços elevados no exterior.
(Fonte: China Securities Journal)