Quando a comercialização de poder de computação acontecer, quanto tempo ainda levará para o mercado de futuros de GPU?

nulo

Autor: Caleb Shack, Alana Levin

Tradução: Jiahua, ChainCatcher

Na Variant, somos apaixonados por explorar mercados emergentes. Novas categorias de ativos, produtos financeiros, emissão de ativos, expansão do acesso ao mercado e formas inovadoras de participação estão profundamente enraizadas em nossa genética de criação.

Recentemente, temos refletido sobre o mercado em torno do poder computacional.

A obtenção de poder computacional é um campo vasto e em constante crescimento, e pode-se dizer que já possui condições para uma maior金融ização.

No entanto, a dinâmica de oferta e demanda de poder computacional é altamente complexa, opaca e está em constante evolução. Ainda há muitos mistérios sobre o timing do mercado, sua estrutura e até mesmo quais ativos específicos estão sendo negociados.

Durante debates e discussões sobre essas questões, desejamos compartilhar uma nova estrutura analítica como uma janela para pensar sobre o mercado de poder computacional emergente.

O nascimento de um novo mercado de futuros geralmente requer os seguintes cinco pré-requisitos:

Fragmentação da oferta

Oscilações contínuas de preço

Alguma forma de infraestrutura de liquidação física

Unidades padronizadas e negociáveis

Falta de substitutos para descoberta de preço ou hedge

Nossa estrutura coloca o cenário atual do mercado de poder computacional nesses cinco aspectos. Usamos analogias históricas para explicar a importância de cada dimensão e prever quando o mercado poderá atingir um ponto de ruptura.

Resumo dos pontos principais

Uma rápida análise dessa estrutura revela que, atualmente, o mercado de poder computacional ainda não possui maturidade suficiente para sustentar um mercado de futuros robusto.

(Embora, é claro, esse mercado seja vibrante, com muitas startups dedicadas a mudar esse cenário; se você estiver fazendo isso, entre em contato conosco!)

A seguir, nossa avaliação atual do mercado de futuros de poder computacional em relação aos cinco aspectos:

Fragmentação da oferta: 🔴 Oferta altamente monopolizada por grandes provedores de nuvem

Oscilação de preço: 🟢 Preços de GPU extremamente voláteis

Infraestrutura de liquidação física: 🟢 Corretoras OTC já possuem infraestrutura de liquidação física

Padronização: 🔴 Falta de unidades padronizadas e negociáveis de poder computacional

Falta de substitutos: 🟡 Fornecedores verticalmente integrados podem fazer hedge internamente, outros participantes só podem se posicionar longamente

  1. Fragmentação da oferta (pontuação de poder computacional: 🔴)

O mercado de futuros é um mecanismo de descoberta de preços.

Sob uma oferta monopolista, a descoberta de preços perde sua necessidade, pois os preços são definidos por poucos grandes fornecedores, eliminando qualquer incerteza na formação de preços.

Historicamente, essa situação não é incomum.

Os futuros de petróleo só se fortaleceram após o enfraquecimento de cartéis de oferta, como as “Sete Irmãs” — sete multinacionais que dominaram o petróleo global na metade do século XX.

O mercado de energia elétrica se formou após a desregulamentação, rompendo monopólios de preços e permitindo a entrada de produtores independentes. A fragmentação da oferta impulsionou os futuros a se tornarem um importante mecanismo de descoberta de preços.

Ao analisar a dinâmica atual do poder computacional, a oferta parece relativamente concentrada.

As quatro maiores gigantes de nuvem (como AWS, Azure, GCP, Oracle) controlam cerca de 78% da capacidade de TI crítica autogerida globalmente, além de aproximadamente 69% da oferta de H100 (estimado que há 12,4 milhões de unidades de H100 no Q4 de 2025).

Dessa forma, inferimos que também dominam a oferta global de tempo de poder computacional. A oferta não mostra sinais de fragmentação.

Ainda assim, estamos refletindo sobre fatores que podem alterar essa dinâmica.

Novos provedores de nuvem estão surgindo. Novas arquiteturas de chips criam oportunidades para outros fornecedores ganharem participação de mercado.

Capacidades de contratos de longo prazo de laboratórios principais podem não ser totalmente utilizadas, o que pode levar esses laboratórios a se tornarem fornecedores ou vendedores de poder computacional no mercado.

Portanto, embora a concentração futura seja incerta, nossa avaliação atual é que a direção do desenvolvimento da oferta de mercado tenderá a ser mais fragmentada do que atualmente.

  1. Oscilação de preço (pontuação de poder computacional: 🟢)

Índice Ornn H100 na terminal Bloomberg

Outro pré-requisito para o mercado de futuros é que o ativo subjacente seja altamente volátil.

Sem uma incerteza de preço significativa, os hedgeadores não terão motivação para se proteger contra riscos de oscilações.

A volatilidade também atrai especuladores, que podem lucrar com grandes variações de preço. Se o mercado for estável ou previsível, esses participantes migrarão para outros mercados.

Vemos esse fenômeno na história do mercado de petróleo dos anos 50.

Na época, devido ao excesso de oferta, o preço do petróleo da União Soviética ficou abaixo do preço de referência das “Sete Irmãs”. Essas multinacionais reduziram seus preços na região sem aviso prévio aos países produtores do Oriente Médio.

O impacto em cadeia levou à nacionalização do petróleo no Oriente Médio, à criação da OPEP e ao aumento da incerteza nos preços globais do petróleo. Posteriormente, essa volatilidade impulsionou as oscilações no mercado de energia elétrica na década de 70.

Os preços do poder computacional sempre foram, e continuarão sendo, voláteis.

A velocidade de entrada de novas ofertas no mercado é incerta. Novos chips ou arquiteturas de data center podem melhorar a eficiência de tokens para tarefas específicas. A demanda continua crescendo de forma imprevisível.

Estamos confiantes de que esse pré-requisito já está presente atualmente.

  1. Infraestrutura de liquidação física (pontuação de poder computacional: 🟢)

Para que o mercado funcione eficientemente, os compradores precisam estar seguros de que poderão receber e consumir o ativo na data e hora previstas.

Isso exige infraestrutura de suporte: agregação de oferta, garantia de entrega confiável, liquidação de transações, gerenciamento de garantias e mecanismos de compensação. Essas funções geralmente são realizadas por intermediários ou corretoras.

No mercado de energia, essas tarefas são de responsabilidade de operadores de sistemas independentes, que atuam como entidades neutras e desempenham papel semelhante ao de órgãos reguladores.

Atualmente, o mercado de poder computacional ainda não possui um papel totalmente equivalente, mas nossa hipótese é que corretoras de poder ou balcões OTC estão começando (e cada vez mais tendendo) a assumir muitas dessas funções.

Hoje, corretoras estão construindo índices e ferramentas de agregação de dados baseados em contratos de compra e aluguel de poder computacional, para estabelecer preços de referência.

Ornn e Silicon Data já começaram a divulgar dados de preços de GPUs de data center.

O grupo de corretoras também está formando consenso sobre contratos, de modo semelhante ao padrão SAFE, que padronizou os termos de financiamento inicial. Essas ferramentas aprimoram a infraestrutura de liquidação física subjacente — que, até então, muitas vezes, permanecia em conversas de grupo.

Damos nota verde para a infraestrutura de liquidação física, pois ela é fundamental para a descoberta de preços.

Por outro lado, ela ainda está longe de ser perfeita em comparação com mercados de spot maduros. Essas compras ocorrem na camada de infraestrutura, e nem todos os participantes podem revender publicamente após a compra. Estamos acompanhando de perto o progresso na criação de novos mercados nessa camada.

  1. Padronização (pontuação de poder computacional: 🔴)

Um dos principais desafios de novos produtos é a singularidade e a não substituibilidade de suas unidades.

Muitos variáveis podem dispersar a liquidez em diversos mercados ou gerar riscos de base (básico) elevados demais para atender às necessidades de hedge e entrega.

Por exemplo, o petróleo é medido por densidade e teor de enxofre, variando conforme a origem.

A NYMEX encontrou um ponto de encaixe de produto com seu índice WTI (óleo leve de baixo enxofre), que oferece um padrão que atende ao mercado global upstream e é usado por downstream, como companhias aéreas, para hedge.

No mercado de energia, a padronização é regional, considerando variações de demanda e oferta por fatores como temperatura e densidade populacional.

O mercado de poder computacional carece de um padrão que atenda às necessidades gerais de hedge.

O desafio é que um exemplo de H100 não é sempre equivalente a outro.

Fatores como região (entrada de energia local), configuração do hardware (componentes de hardware e rede) e prazo (duração do contrato) aumentam a variação de preços de instâncias de GPU.

No entanto, já há sinais iniciais de padronização, especialmente quando a demanda vem de inferências de cauda longa (não de laboratórios de ponta).

Ao contrário do treinamento, as cargas de trabalho de inferência requerem diferenças menores e podem ser executadas em ambientes distribuídos e não necessariamente no mesmo local.

Se a oferta de inferência for dispersa entre muitos fornecedores, por exemplo, com modelos de código aberto aumentando a participação de mercado, a padronização pode surgir naturalmente.

  1. Falta de substitutos (pontuação de poder computacional: 🟡)

Este é um ponto sutil, muitas vezes negligenciado, no processo de formação do mercado.

A criação de mercados de futuros visa atender aos hedgeadores. Se existirem substitutos com liquidez suficiente e risco de base desprezível, esses contratos substitutos não terão demanda.

Um exemplo clássico é a falta de adoção de futuros de combustível de aviação — pois índices upstream como WTI já atendem às necessidades.

Na área de energia, futuros baseados em temperatura fracassaram, pois os participantes perceberam que fazer hedge contra a volatilidade do preço da energia (resultado) é mais eficiente do que fazer hedge contra a causa (temperatura).

Hoje, fornecedores de modelos fazem hedge de risco de poder computacional por meio de contratos de aluguel de longo prazo ou joint ventures, geralmente na forma de “pague e não discuta”, trocando risco de preço à vista por risco de contraparte.

Grandes provedores de nuvem geralmente possuem seus próprios GPUs implantados.

Por outro lado, fornecedores de cauda longa carecem de contratos vantajosos e de capital para construir infraestrutura própria, sofrendo mais com a volatilidade do mercado à vista.

Do ponto de vista do mercado, não há substitutos; mas os participantes que controlam a oferta podem fazer hedge interno por meio de integração vertical.

Avaliação geral

Com base na pontuação geral, ainda é cedo para que o poder computacional sustente um mercado de futuros robusto.

Embora haja volatilidade atraente para especuladores e infraestrutura inicial de liquidação para facilitar negociações, falta fragmentação de oferta e padronização necessárias para uma descoberta de preços em larga escala.

A maior parte das negociações ocorre OTC.

Corretoras estão construindo fontes de preço, Ornn e Silicon Data estão lançando índices, e negociações em grupos de chat estão sendo padronizadas em contratos modelo.

Embora isso seja significativo, ainda não se trata de um mercado maduro como WTI ou PJM. O volume de negociações é pequeno, os contratos são altamente customizados e a oferta é concentrada demais, impedindo a liquidação em larga escala pela infraestrutura existente.

A leitura correta desse quadro é usá-lo como uma ferramenta de diagnóstico, não como uma conclusão definitiva. Ele nos mostra o que falta, não o que é impossível.

Mistérios a serem resolvidos

O mercado evoluirá de maneiras que ainda não podemos prever com certeza.

Temos muitas incógnitas e algumas hipóteses preliminares. Essas hipóteses são exploratórias, necessitando de validação ou refutação adicional. A seguir, apresentamos os argumentos mais fortes dessas hipóteses.

▍Nos próximos 1-2 anos, o fornecimento de mercado ficará mais fragmentado ou mais concentrado?

Prevemos uma fragmentação moderada.

A velocidade de entrada de novos provedores de nuvem é maior do que qualquer outra categoria.

Com a energia se tornando uma restrição central, novas regiões estão sendo ativadas, favorecendo operadores capazes de estabelecer capacidade perto de energia barata (não necessariamente perto de grandes centros de nuvem existentes).

Empresas listadas na Fortune 2000 estão apoiando pequenos data centers. Essa expansão parece inevitável.

No entanto, o modelo de negócios padrão depende de contratos de longo prazo com parceiros confiáveis (como grandes provedores de nuvem e laboratórios de ponta).

Provedores de serviços de nuvem como Hyperbolic e SF Compute oferecem capacidade sob demanda, por hora.

Essas empresas atendem startups de IA, aplicações de inferência em modelos de código aberto e laboratórios de pesquisa com orçamentos limitados, que têm demandas de poder computacional de cauda longa.

Acreditamos que a adoção de modelos de código aberto, especialmente, levará a uma maior fragmentação de capacidade — pois a oferta sairá de laboratórios de ponta e grandes provedores de nuvem, “desverticalizando” a oferta.

▍Como a padronização se desenvolverá?

Provedores de índices estão criando padrões para o custo por hora de instâncias de GPU.

Essas fontes de dados representam estimativas aproximadas, não preços exatos.

Os preços variam por fatores como região, configuração do hardware e prazo, dificultando a padronização de preços.

A diferenciação na configuração do hardware é especialmente pronunciada, resultado de data centers customizados para cargas de trabalho específicas e de otimizações feitas por grandes provedores de nuvem para fidelizar clientes, não para unificar o mercado.

Quando há uma demanda de mercado unificada, surgem padrões.

O padrão WTI foi adotado por atender a uma ampla gama de produtos downstream, como gasolina, diesel e querosene de aviação.

Hoje, a demanda por poder computacional é impulsionada por cargas de trabalho de treinamento e inferência de IA.

Infraestrutura de treinamento é altamente customizada, otimizada para tarefas longas e computacionalmente intensivas em instalações centralizadas, tornando as instâncias de base quase não substituíveis.

Por outro lado, infraestrutura de inferência requer hardware mais simples, menor consumo de energia e é otimizada para baixa latência, com distribuição geográfica ao invés de implantação no mesmo local.

A inferência é altamente homogênea, e espera-se que, até 2029, mais de 65% da demanda de poder computacional de IA seja de inferência. Acreditamos que melhorias na infraestrutura de poder computacional voltada para esse mercado levarão a uma maior padronização entre fornecedores.

Se ainda houver diferenças ao nível de chips, uma alternativa será a padronização por meio de benchmarks de hardware.

A Nvidia criou o benchmark MLPerf para avaliar desempenho de inferência e treinamento de diversos modelos.

Nesse cenário, a negociação de instâncias de GPU não será baseada apenas na especificação do hardware, mas na qualidade e eficiência do output.

▍Nos próximos 1-2 anos, o que pode impedir o surgimento de padrões?

Acreditamos que “jardins murados” e cargas de trabalho altamente customizadas irão sufocar tentativas de padronização.

Nos próximos 1-2 anos, grandes provedores de nuvem e laboratórios de ponta irão lutar para manter seu domínio em infraestrutura de IA e fornecimento de modelos.

Se não se desacoplarem, manterão seus próprios hardwares de acordo com suas necessidades, que variam bastante. A adoção de novas arquiteturas de chips também fragmentará ainda mais as especificações de hardware, dificultando a criação de padrões.

▍Como as weights de código aberto terão aplicações relevantes?

Este é o caminho mais simples para a formação do mercado de poder computacional.

Hoje, os principais obstáculos são a concentração da oferta e a falta de padronização.

A adoção ampla de weights de código aberto democratiza a capacidade de executar inferência.

Isso, por sua vez, motiva operadores independentes e incentiva a otimização de infraestrutura específica para esses modelos.

Vemos uma história semelhante na mineração de Bitcoin: software de código aberto gerou uma grande quantidade de mineradores e impulsionou a padronização de hardware.

Até agora, weights de código aberto têm ficado atrás de modelos fechados em desempenho.

Mas, se essa tendência continuar, em breve weights de código aberto alcançarão os níveis de desempenho que hoje vemos em modelos fechados.

Empresas já estão integrando amplamente modelos fechados em seus sistemas, testemunhando ganhos de produtividade. Em três meses, um modelo que aumenta a produtividade pode custar uma fração do preço atual.

Por outro lado, a maioria das empresas ainda preferirá modelos de desempenho superior.

Acreditamos que, um dia, modelos fechados de ponta se tornarão excessivamente caros para suas tarefas, levando as empresas a otimizar suas configurações entre diferentes modelos.

É importante lembrar que laboratórios de ponta atualmente oferecem inferência a custo de prejuízo, e precisam aumentar preços para manter operações. Nesse momento, weights de código aberto terão seu próprio momento de destaque.

▍Qual será a unidade de precificação final das negociações?

O poder computacional pode ser aproximadamente decomposto em três camadas: chip, hora de instância de chip, Token.

Camada de chips — oferta altamente concentrada.

A ASML monopoliza as máquinas de litografia usadas pela TSMC, que por sua vez monopoliza as fábricas de chips da Nvidia, que monopoliza o design de chips de ponta.

Além disso, chips só têm valor se estiverem conectados à energia e operando com alta disponibilidade. Isso nos leva a crer que um chip individual, entregável, não será a unidade final de precificação.

Camada de hora de instância de chip — refere-se ao tempo efetivo de uso do chip.

Essa é a condição mais valiosa do chip, e também o núcleo da discussão aqui.

Nessa camada, enquanto houver demanda suficiente por recursos de poder computacional, a sua representação como mercadoria será similar à energia elétrica.

Imaginamos que o poder computacional será negociado de forma semelhante a energia e outros serviços públicos: com contratos regionais padronizados (poder computacional como função da energia), complementados por mercados spot e futuros para hedge. Essa abordagem é viável na estrutura de “hora de instância de chip”.

Camada de Token — é o produto downstream do poder computacional, que também pode se tornar a unidade final de precificação.

Se o Token for o principal driver de instâncias de poder computacional, o mercado de Token oferecerá uma forma de hedge de custos para a demanda e permitirá que a oferta fixe receitas.

A oferta pode fazer hedge por meio de contratos de longo prazo ou integração vertical, mantendo concentração.

Por outro lado, o Token não é uniforme entre modelos. Cada modelo tem seus próprios critérios de tokenização e gera outputs diferentes, tornando-os não totalmente intercambiáveis entre casos de uso. Ainda assim, estamos atentos ao desenvolvimento nessa área.

BTC-2,11%
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado