Google e Nvidia apostam na OpenRouter: O momento de ouro da economia de tokens?

Uma rodada de financiamento de 113 milhões de dólares respondeu a duas questões sempre vagas na indústria de IA: qual é a unidade de liquidação desta revolução industrial e quem vai construir sua infraestrutura.

13 bilhões de dólares de avaliação não representam uma empresa, mas o valor de uma posição na economia de tokens.

26 de maio de 2026, a OpenRouter completou uma rodada Série B de 113 milhões de dólares. O que ela faz não é complicado — através de uma API, conecta desenvolvedores e empresas a mais de 400 modelos de IA, com cobrança unificada e roteamento inteligente. Não constrói modelos, não vende poder de computação, lucra com as comissões intermediárias. 8 milhões de usuários, escala quintuplicada em seis meses.

Mas veja quem está investindo nela: CapitalG do Google lidera, NVentures da Nvidia acompanha, os departamentos de investimento estratégico da ServiceNow, MongoDB, Snowflake, Databricks entram em cena, e a a16z e Menlo Ventures aumentam seus aportes.

Um que constrói modelos, outro que fabrica chips, ambos aparecem na lista de investidores de uma plataforma de distribuição de tokens — e a jogada do Google vai muito além de um investimento financeiro. No mesmo mês, a Palo Alto Networks adquiriu a concorrente Portkey, avaliada entre 120 e 140 milhões de dólares. No mesmo setor, financiamento independente e fusões e aquisições surgem simultaneamente como caminhos de saída.

Isso não é uma avaliação de uma única empresa. É uma avaliação de uma posição — aquela camada intermediária que faz os tokens fluírem. Como será essa camada? Um roteador, uma rede elétrica, ou um Taobao da economia de tokens?

Mo Jomaa, parceiro da CapitalG: 「Cada mudança de plataforma cria uma lacuna na infraestrutura: na era da internet, tinha Cloudflare; no pagamento digital, Stripe; na era dos dados, Databricks. OpenRouter é a lacuna na infraestrutura da era da inferência de IA.」

Mo Jomaa acertou na localização. Mas uma pergunta mais importante é: por que justamente tokens?

I. Token: a unidade de liquidação na era da IA

Tokens não são o combustível da IA. São a medida da IA.

Cada revolução industrial só começa a se consolidar quando algo é padronizado, mensurado, avaliado e trocado — só então a infraestrutura ao redor realmente começa a se construir. Antes, carvão era só minério, eletricidade era só uma experiência de laboratório, banda larga era só uma pesquisa acadêmica.

A chave para transformar recursos em unidades econômicas não está no uso, mas na existência de uma medida — com uma medida, nasce o mercado. Nos últimos dois anos, a medida da IA foi sempre vaga: poder de cálculo, GPU, capacidade de modelos, dados — todos relevantes, mas imprecisos. São ferramentas de produção, não unidades de liquidação.

Em março de 2026, Jensen Huang definiu a resposta na GTC. Ele deixou de chamar data centers de "data centers" e passou a chamá-los de "fábricas de tokens" — matérias-primas: energia elétrica e dados; unidade econômica básica: tokens. Na revolução industrial anterior, fábricas produziam eletricidade; nesta, a fábrica de IA produz inteligência.

A grandeza da eletricidade não foi descobrir uma nova fonte de energia, mas criar uma interface universal — ela converte carvão, hidrelétricas, petróleo, energias não intercambiáveis, em formas padronizadas, transmissíveis, armazenáveis, controláveis e plugáveis.

A IA está fazendo o mesmo com a inteligência. A capacidade de análise de advogados, a codificação de programadores, o diagnóstico de médicos — essas inteligências existiam apenas na mente de indivíduos, sem armazenamento, com alta rotatividade, altos custos de chamada e sem possibilidade de comércio transfronteiriço.

Tokens foram a primeira vez que esses recursos foram extraídos da mente humana, transformando-se em APIs padronizadas acessíveis 24/7. Assim como a eletricidade padronizou energia, os tokens padronizaram inteligência.

Mas tokens e eletricidade têm uma diferença fundamental. A eletricidade é apenas um vetor de energia: ela transmite energia, não contém informação, não faz julgamento, não é produto. Tokens são diferentes — eles são ao mesmo tempo combustível de IA (para inferência), produto (saída de modelos), unidade de cobrança (modelo de negócio) e recurso estratégico (foco de competição geopolítica), tudo ao mesmo tempo. Quase não há outro produto na história econômica que desempenhe esses quatro papéis simultaneamente.

Essa distinção já foi reconhecida em nível político. O diretor da Agência Nacional de Dados, Liu Lihong, deu ao token um nome em chinês: "cíyuán" (词元), chamando-o de "unidade de liquidação" que conecta oferta tecnológica e demanda comercial. Seus dados confirmam a aceleração: o volume diário de chamadas de cíyuán na China saltou de 1 trilhão no início de 2024 para 140 trilhões em março de 2026, um crescimento de mais de mil vezes em dois anos. Em 22 de maio — quatro dias antes do anúncio de financiamento da OpenRouter —, a Agência Nacional de Dados realizou uma "Mesa Redonda sobre a Economia de Cíyuán", incluindo a promoção do desenvolvimento dessa economia na agenda oficial.

Quando uma unidade de liquidação é avaliada pelo mercado e nomeada pelo Estado, a corrida por sua infraestrutura já começou.

II. O que a OpenRouter fez

Quem construiu o maior marketplace de NFTs viu uma oportunidade estrutural semelhante no mercado de tokens de IA — a metodologia é idêntica.

Alex Atallah, fundador da OpenRouter, foi cofundador e CTO da OpenSea, criado em 2017 com Devin Finzer, saiu em 2022. A essência da OpenSea é uma entrada de tráfego + interface padronizada + comissão — o comprador não precisa saber em qual blockchain o NFT foi cunhado, a plataforma cuida de tudo. Atallah transferiu essa arquitetura para IA: o estoque de JPEGs virou LLMs, a cobrança de ETH virou tokens.

Ele criou a OpenRouter, que se define como "troca de modelos de IA" — por meio de uma API, conecta desenvolvedores e empresas a mais de 400 modelos de fornecedores como Anthropic, Google, OpenAI, xAI, DeepSeek, com seleção sob demanda, roteamento inteligente e cobrança unificada. Hoje, atende mais de 8 milhões de usuários, processando semanalmente 25 trilhões de tokens — seis meses atrás, eram 5 trilhões.

(Um diálogo sem filtros com Alex Atallah, CEO da OpenRouter)

Por que esse crescimento é tão rápido? No blog após o investimento da Menlo Ventures, eles desmembraram uma percepção central:

O uso massivo de IA é, fundamentalmente, um problema de múltiplos modelos. Você não precisa de um Ferrari para fazer compras, mas também não pode usar uma bicicleta na highway — resumos podem usar modelos pequenos e baratos, inferência profunda requer modelos de ponta, multimodalidade exige uma abordagem diferente.

A pesquisa da Deloitte de 2026 mostra que 67% das empresas consomem mais de 10 bilhões de tokens por mês, enquanto a pesquisa da F5 revela que, em média, cada empresa opera 7 modelos de IA diferentes ao mesmo tempo. E o mesmo modelo, rodando em fornecedores diferentes, tem tempos de resposta, preços e qualidade de saída distintos. Além disso, a maioria das APIs de LLM não garante 90% de uptime, e cada empresa gerencia suas chaves e cobrança de forma independente — não faltam modelos, falta uma camada intermediária que os torne todos utilizáveis.

Andrej Karpathy chama a OpenRouter de "interruptor de transferência" de IA: ela não gera energia, não fabrica aparelhos, mas decide de onde vem a energia e como ela é distribuída. Mas seu valor vai além do roteamento.

O que a OpenRouter faz, essencialmente, é equipar cada máquina com um motor independente: permite que empresas organizem suas capacidades de IA por necessidade de negócio, não por fornecedor. Isso não é só redução de custos ou aumento de eficiência, é uma mudança na organização.

Dados recentes do Vercel AI Gateway confirmam essa lógica. Em abril de 2026, por volume de consumo, Anthropic representava 61%, Google 21%, OpenAI 12%; mas por volume de tokens, Google respondia por 38%, Anthropic por 26%, OpenAI por 13%. Modelos baratos consomem volume, modelos caros consomem dinheiro — o mesmo cliente, escolhas diferentes em dimensões diferentes. Essa é a verdadeira essência de "multi-modelos": não escolher o melhor, mas o mais adequado para cada cenário.

III. Por que essa posição é a entrada mais importante na economia de tokens

Quando nenhum modelo consegue cobrir todos os cenários, o valor da camada intermediária surge. Essa conclusão não é só uma hipótese de analistas.

3.1 O julgamento coletivo dos investidores

(Levantamento de Série B da OpenRouter)

O grupo de investidores dessa rodada não é apenas "VCs apoiando uma empresa" — é uma aliança de toda a cadeia de valor da IA, do upstream ao downstream.

CapitalG (Google/Alphabet) lidera. A Google tem o Gemini, mas aposta em uma plataforma neutra de distribuição de modelos. Isso não é contraditório — a Google não pode vencer todos os clientes com Gemini, apoiar uma plataforma neutra garante que seus modelos também sejam distribuídos ali.

Jane Alexander, parceira da CapitalG, explica: 「OpenRouter tem uma posição única, pode se tornar o centro de liquidação de dados de modelos de IA e uma camada inteligente unificada.」

Mas se interpretarmos isso apenas como "Google quer distribuir Gemini", estamos subestimando a jogada.

Ao juntar os três movimentos de maio da Google: CapitalG liderando o financiamento da OpenRouter (a camada de roteamento — quem pensa na "mente" do agente), a doação do protocolo AP2 para a FIDO Alliance (camada de protocolo — como o agente autoriza a carteira), e o lançamento do Universal Cart na I/O (camada de entrada — onde o agente realiza compras no ecossistema), fica claro que a Google não precisa vencer na guerra de protocolos, mas sim garantir que, na camada de roteamento e na de entrada, seja a opção padrão.

Quando os três passos — seleção de modelos, autorização e compra — estão sob influência da Google, ela controla não o protocolo, mas os três pontos de passagem obrigatória do fluxo.

NVentures (Nvidia) acompanha. O interesse da Nvidia é direto — mais tokens consumidos = mais inferências feitas = mais GPUs compradas. A OpenRouter funciona como um amplificador de inferência. É o mesmo raciocínio do investimento na CoreWeave: não importa quem ganha na competição de modelos, mas sim ampliar o volume total.

ServiceNow, MongoDB, Snowflake, Databricks entram com seus departamentos de investimento estratégico. São empresas de infraestrutura de software corporativo. A entrada delas indica que clientes empresariais estão migrando de "escolha tecnológica" para "infraestrutura padrão" de múltiplos modelos.

a16z, Menlo Ventures, Sequoia aumentam seus aportes. Menlo, um ano atrás, investiu quando a OpenRouter tinha 2,5 milhões de desenvolvedores e processava cerca de 100 trilhões de tokens por ano. Agora, são 8 milhões de desenvolvedores e 1,5 quadrilhão de tokens anuais. Deedy Das, da Menlo, fez uma comparação surpreendente: a capacidade de tokens da OpenRouter já equivale a 15-30% da Google, 20-40% da OpenAI e mais de 50% da Azure Foundry. Além disso, ele revelou que, de fevereiro a maio, a receita dobrou após assinatura.

Quando fornecedores de modelos (Google), fabricantes de chips (Nvidia), empresas de software (ServiceNow, Databricks, Snowflake, MongoDB) e fundos de venture capital de ponta (a16z, Sequoia, Menlo) aparecem juntos na cap table, isso não é apenas uma aposta na empresa. É uma votação de toda a cadeia de valor com dinheiro de verdade.

$113M 3.2 Confirmação pelos dados do setor

O TechCrunch avalia: 「O sucesso da OpenRouter significa que os modelos de IA estão se tornando motores invisíveis e intercambiáveis. Empresas não pretendem ficar presas a um único fornecedor, como na era SaaS. O futuro é de múltiplos modelos.」

E o crescimento dos modelos chineses reforça essa visão. Durante o feriado do Ano Novo Chinês de 2026, os modelos chineses chegaram a representar 61% do consumo de tokens na plataforma da OpenRouter. Quando modelos americanos e chineses são escolhidos sob demanda por desenvolvedores globais na mesma plataforma, múltiplos modelos deixam de ser uma tendência e se tornam uma realidade.

Mas o ponto-chave aqui não é "múltiplos modelos" em si — e sim quem controla a entrada entre modelos e usuários.

A lista de modelos da OpenRouter já é uma das métricas mais citadas na indústria global de IA — investidores, pesquisadores e mídia monitoram esse ranking para captar tendências. Quando toda a indústria usa seus dados para tomar decisões, você deixa de ser apenas um roteador e passa a ser o centro de informações do ecossistema. Isso não é uma função acessória, é um poder estrutural: cada roteamento é uma coleta de dados, cada fluxo uma representação em tempo real da demanda global por IA.

Na era da eletrificação, quem controla o poder é a rede elétrica, não a usina. Na internet, quem manda são os motores de busca e as lojas de aplicativos. Na economia de tokens, o laboratório de modelos é a usina, as empresas e agentes finais são os aparelhos, e a camada de roteamento — que decide qual requisição vai para qual modelo — é a rede elétrica.

Quem controla essa entrada, controla o mapa da economia de tokens.

IV. O futuro da economia de tokens: o que o comércio eletrônico pode nos ensinar

Headless merchant já existe. Mas ninguém respondeu onde eles devem aparecer.

Noah Levine, da a16z, definiu em março esse conceito: sem loja física, sem sistema de contas, sem equipe de vendas, apenas um servidor, um conjunto de APIs, um preço por uso.

Na primeira semana do lançamento do protocolo Machine Payments da Stripe, mais de 60 serviços headless foram lançados, e 894 agentes realizaram 31 mil transações. Cuy Sheffield e Levine, do Visa, discutiram em um podcast essa tendência — o pagamento por token está substituindo assinaturas, e agentes estão substituindo consumidores. A definição está dada, o protocolo existe, as transações acontecem.

Mas onde esses headless merchants vão aparecer?

Se 60 serviços cabem em um diretório, o que dizer de 6 mil? E de 600 mil? Os agentes podem vasculhar a web em busca de APIs, mas na prática precisam de um lugar com ranking, dados de confiabilidade, cobrança unificada para descobrir e comparar. Esse lugar tem um nome: marketplace.

Hoje, a OpenRouter é uma versão inicial desse marketplace — só que, por enquanto, só com um tipo de headless merchant: fornecedores de LLM. Se considerarmos a trajetória do OpenSea, que expandiu de uma categoria (PFP) para todas as categorias de ativos digitais, é previsível que a categoria de headless merchants também se expanda de LLM para geração de imagens, busca de dados, processamento de documentos, validação de pagamentos — é uma previsão, mas sem precedentes.

Se usarmos a evolução do comércio eletrônico como guia, a evolução do marketplace de tokens provavelmente passará por três fases:

Primeira fase: padronização do marketplace. Como o Taobao no início, que definiu categorias, rankings, avaliações, pagamento unificado, o OpenRouter está usando uma enorme quantidade de transações para definir "como deve ser uma API de LLM" — normas de nomenclatura, formatos de preço, indicadores de usabilidade, parâmetros de contexto. Essas normas não são criadas por um comitê, mas emergem da prática de muitas transações. Não há padrão de início.

Segunda fase: fortalecimento do ecossistema. Essa é a camada mais superficial do momento atual do OpenRouter. Como no comércio eletrônico: o diferencial do Taobao não é só a busca, mas a personalização da loja, publicidade direcionada, sistema de avaliações, crédito. O OpenRouter ainda precisa de um motor de recomendações (evolução do roteamento para "sugestões"), avaliações por cenário (não só volume total, mas pontuações específicas por lei, código, tradução), ferramentas financeiras (pré-venda de tokens, gestão de orçamento, crédito ao consumo), e um ecossistema de terceiros (plugins, fine-tuning hospedado, marketplace de prompts). Esses elementos formam a verdadeira barreira de entrada.

Terceira fase: A2A (agent-to-agent) saindo do marketplace. Quando os padrões estiverem maduros e os dados confiáveis, os principais clientes irão "graduar" — conectar-se diretamente aos headless merchants, sem passar pelo marketplace. Como grandes marcas que deixam o Taobao para abrir sua própria loja no Shopify, ou empresas que usam LiteLLM para montar suas próprias rotas. Mas o marketplace não desaparece — ele vira uma camada de descoberta e confiança, onde clientes médios e serviços de cauda longa permanecem.

Na história, esse é sempre o percurso: primeiro, uma bolsa centralizada que define padrões e liquidação; depois, digitalização e dark pools; primeiro, SWIFT e Visa que criaram a rede de pagamentos; depois, P2P e blockchain; primeiro, Amazon e Taobao que estabeleceram padrões de comércio eletrônico; depois, Shopify que permitiu que comerciantes criassem suas lojas independentes.

Padronização e confiança primeiro, depois descentralização que herda esses padrões.

Esse é o verdadeiro desafio da OpenRouter. Uma taxa de 5% de comissão é um custo relevante para grandes clientes — empresas que gastam mais de 37 mil dólares por mês em inferência, por exemplo, prefeririam montar seu próprio sistema com LiteLLM. Vercel AI Gateway já oferece zero markup por token, Cloudflare integra IA como funcionalidade gratuita.

A avaliação da Trends.vc é sóbria: 「Quando um player com recursos promete uma precificação passthrough, os concorrentes seguem. O lucro se desloca do roteamento para cache, governança e integração profunda.」

A resposta final do comércio eletrônico foi: Taobao venceu a discussão "por que não montar seu próprio site", não por ser melhor em busca, mas porque lá estavam os compradores, as avaliações, a confiança.

Se a OpenRouter chegar lá, dependerá de conseguir fortalecer seu ecossistema antes que a taxa de comissão seja comprimida. A avaliação de 1,3 bilhão de dólares não é pelo 5% de hoje — é pelo potencial de evoluir de marketplace para sistema operacional.

V. Conclusão

Se a OpenRouter será ou não a vencedora final, é uma questão aberta. Mas essa rodada de financiamento marca um ponto irreversível — os padrões estão sendo definidos pelo volume de transações, a confiança está sendo acumulada na plataforma. A questão não é mais "se construir a infraestrutura de tokens", mas quem construí-la de forma que seja herdada.

E quanto a esse ser o momento do Taobao da economia de tokens — a resposta depende de quem primeiro fortalecer seu ecossistema. A janela de oportunidade já está aberta.

GOOGLX-1,86%
TOKEN3,6%
NVDA-2,4%
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado