Quando a comercialização de poder de processamento, quanto tempo ainda falta para o mercado de futuros de GPU?

nulo

Autor: Caleb Shack, Alana Levin

Tradução: Jiahua, ChainCatcher

Na Variant, somos apaixonados por explorar mercados emergentes. Novas categorias de ativos, produtos financeiros, emissão de ativos, expansão do acesso ao mercado e formas inovadoras de participação estão profundamente enraizadas no nosso DNA de criação.

Recentemente, temos refletido sobre o mercado em torno do poder computacional.

A obtenção de poder computacional é um campo vasto e em constante crescimento, e pode-se dizer que já possui condições para uma maior金融ização.

No entanto, a dinâmica de oferta e demanda de poder computacional é altamente complexa, opaca e está em constante evolução. Ainda há muitas incógnitas sobre o timing do mercado, sua estrutura e até mesmo quais ativos específicos estão sendo negociados.

Ao debater e explorar essas questões, desejamos compartilhar uma nova estrutura analítica como uma janela para pensar sobre o mercado de poder computacional.

O nascimento de um novo mercado de futuros geralmente requer os seguintes cinco pré-requisitos:

Fragmentação da oferta

Oscilações contínuas de preço

Alguma forma de infraestrutura de liquidação física

Unidades padronizadas e negociáveis

Falta de substitutos para descoberta de preços ou hedge

Nossa estrutura coloca o cenário atual do mercado de poder computacional nesses cinco aspectos. Usamos analogias históricas para explicar a importância de cada dimensão e prever quando o mercado poderá atingir um ponto de ruptura.

Resumo dos pontos principais

Uma rápida análise dessa estrutura revela que, atualmente, o mercado de poder computacional ainda não possui maturidade suficiente para sustentar um mercado de futuros robusto.

(Embora, é claro, esse mercado seja vibrante, com muitas startups empenhadas em mudar esse cenário; se você estiver fazendo algo assim, entre em contato conosco!)

A seguir, nossa avaliação atual do mercado de futuros de poder computacional em cada uma das cinco dimensões:

Fragmentação da oferta: 🔴 Oferta altamente monopolizada por grandes provedores de nuvem

Oscilação de preços: 🟢 Preços de GPUs altamente voláteis

Infraestrutura de liquidação física: 🟢 Corretoras OTC já possuem infraestrutura de liquidação física

Padronização: 🔴 Falta de unidades padronizadas e negociáveis de poder computacional

Falta de substitutos: 🟡 Fornecedores verticalmente integrados podem fazer hedge internamente, outros participantes só podem se posicionar longamente

  1. Fragmentação da oferta (pontuação de poder computacional: 🔴)

O mercado de futuros é um mecanismo de descoberta de preços.

Sob uma oferta monopolista, a descoberta de preços perde sua necessidade, pois os preços são definidos por poucos grandes fornecedores, eliminando qualquer incerteza na formação de preços.

Historicamente, isso não é incomum.

Futuros de petróleo só se fortaleceram após o enfraquecimento de cartéis de oferta, como as “Sete Irmãs” — sete multinacionais que dominaram o petróleo global na metade do século XX.

O mercado de energia elétrica se formou após a desregulamentação, rompendo monopólios de preços e permitindo a entrada de produtores independentes. A fragmentação da oferta impulsionou os futuros a se tornarem um importante mecanismo de descoberta de preços.

Ao analisar a dinâmica atual do poder computacional, a oferta parece relativamente concentrada.

As quatro maiores gigantes de nuvem (como AWS, Azure, GCP, Oracle) controlam cerca de 78% da capacidade de TI crítica autogerida globalmente, além de aproximadamente 69% da oferta de H100 (estimado que há 12,4 milhões de unidades de H100 em Q4 de 2025).

Dessa forma, inferimos que também dominam a oferta global de tempo de poder computacional. A oferta não mostra sinais de fragmentação.

No entanto, continuamos refletindo sobre fatores que podem alterar essa dinâmica.

Novos provedores de nuvem estão surgindo. Novas arquiteturas de chips criam oportunidades para outros fornecedores ganharem participação de mercado.

Capacidades de contratos de longo prazo de laboratórios principais podem não ser totalmente utilizadas, o que pode levar esses laboratórios a se tornarem fornecedores ou vendedores de poder computacional no mercado.

Portanto, embora a concentração futura seja incerta, nossa avaliação atual é que a direção do desenvolvimento da oferta de mercado será mais fragmentada do que atualmente.

  1. Oscilação de preços (pontuação de poder computacional: 🟢)

Índice Ornn H100 na terminal Bloomberg

Outro pré-requisito para futuros é que o ativo subjacente seja altamente volátil.

Sem uma volatilidade de preços significativa, os hedgeadores não terão incentivo para se proteger contra riscos de oscilações.

A volatilidade também atrai especuladores, que podem lucrar com grandes variações de preço. Se o mercado for estável ou previsível, esses participantes migrarão para outros mercados.

Vemos esse fenômeno na história do mercado de petróleo dos anos 50.

Na época, devido ao excesso de oferta, o preço do petróleo da União Soviética ficou abaixo do preço das “Sete Irmãs”. Essas empresas reduziram seus preços na região sem aviso prévio, após a diminuição do poder de barganha dos produtores do Oriente Médio.

O impacto em cadeia levou à nacionalização do petróleo no Oriente Médio, à criação da OPEP e ao aumento da incerteza nos preços globais do petróleo. Essa volatilidade, por sua vez, alimentou oscilações no mercado de energia elétrica na década de 70.

O preço do poder computacional sempre foi, e continuará sendo, volátil.

A velocidade de entrada de novas ofertas no mercado é incerta. Novos chips ou arquiteturas de data center podem melhorar a eficiência de tokens para tarefas específicas. A demanda continua crescendo de forma imprevisível.

Estamos confiantes de que esse pré-requisito já está presente atualmente.

  1. Infraestrutura de liquidação física (pontuação de poder computacional: 🟢)

Para que o mercado funcione eficientemente, os compradores precisam estar seguros de que poderão receber e consumir o ativo na data e hora acordadas.

Isso exige infraestrutura: agregação de oferta, garantia de entrega confiável, liquidação de transações, gerenciamento de garantias e mecanismos de compensação. Essas funções geralmente são desempenhadas por intermediários ou corretoras.

No mercado de energia, essas tarefas são realizadas por operadores de sistemas independentes, atuando como entidades neutras e quase governamentais.

O mercado de poder computacional ainda não possui um papel totalmente equivalente, mas nossa hipótese é que corretoras de poder ou balcões OTC estão começando (e cada vez mais tendendo) a assumir essas funções.

Hoje, corretoras estão construindo índices e ferramentas de agregação de dados baseados em contratos de compra e aluguel de poder computacional, para estabelecer preços de mercado.

Ornn e Silicon Data já começaram a divulgar dados de preços de GPUs para data centers.

O grupo de corretoras também está formando consenso sobre contratos, semelhantes ao padrão SAFE, que padronizaram os termos de financiamento inicial. Essas ferramentas aprimoram a infraestrutura de liquidação física subjacente — que, até então, muitas vezes, permanecia em grupos de discussão.

Damos nota verde para infraestrutura de liquidação física, pois ela é fundamental para a descoberta de preços.

Por outro lado, ela ainda está longe de ser perfeita em comparação com mercados de spot maduros. Essas compras ocorrem na camada de infraestrutura, e nem todos os participantes podem revender publicamente após a compra. Estamos atentos ao progresso na criação de novos mercados nessa camada.

  1. Padronização (pontuação de poder computacional: 🔴)

Um dos principais desafios de novos produtos é a singularidade e a não substituibilidade de suas unidades.

Muitos variáveis podem dispersar a liquidez entre diversos mercados ou gerar riscos de base excessivos, dificultando a cobertura e a entrega na maioria dos casos.

Por exemplo, o petróleo é medido por densidade e teor de enxofre, variando conforme a origem.

A NYMEX encontrou um ponto de encaixe ao criar o índice WTI (petróleo leve de baixo enxofre), que oferece um padrão para o mercado global upstream e é usado por downstream, como companhias aéreas, para hedge.

No setor de energia, a padronização é regional, considerando variações de demanda e oferta devido a fatores como temperatura e densidade populacional.

O mercado de poder computacional carece de um padrão que atenda às necessidades gerais de hedge.

O desafio é que um exemplo de H100 não é sempre equivalente a outro.

Fatores como região (entrada de energia local), configuração do hardware (componentes de hardware e rede) e prazo (duração do contrato) aumentam a variabilidade de preços de instâncias de GPU.

No entanto, já observamos sinais iniciais de padronização, especialmente quando a demanda vem de workloads de inferência de cauda longa (não de laboratórios de ponta).

Ao contrário do treinamento, as diferenças mínimas necessárias para inferência podem ser executadas em ambientes distribuídos e não necessariamente no mesmo local.

Se a oferta de inferência for dispersa entre muitos fornecedores, por exemplo, com modelos de código aberto aumentando a participação de mercado, a padronização poderá surgir naturalmente.

  1. Falta de substitutos (pontuação de poder computacional: 🟡)

Este é um ponto muitas vezes negligenciado no processo de formação do mercado.

A criação de futuros visa atender aos hedgeadores. Se existirem substitutos com liquidez suficiente e risco de base desprezível, contratos substitutos não terão demanda.

Um exemplo clássico é a falta de adoção de futuros de combustível de aviação — pois índices upstream como WTI já atendem às necessidades.

Na área de energia, futuros baseados em temperatura fracassaram, pois os participantes perceberam que fazer hedge contra a volatilidade do preço da energia é mais eficiente do que fazer hedge contra a causa (temperatura).

Hoje, fornecedores de modelos fazem hedge de risco de poder computacional por meio de contratos de aluguel de longo prazo ou joint ventures, geralmente na forma de “pague e não discuta”, trocando risco de preço à vista por risco de contraparte.

Grandes provedores de nuvem geralmente possuem seus próprios GPUs implantados.

Por outro lado, fornecedores de cauda longa carecem de contratos vantajosos e de capital para construir infraestrutura própria, sofrendo mais com a volatilidade do mercado à vista.

Do ponto de vista do mercado, não há substitutos; mas os participantes que controlam a oferta podem fazer hedge interno por meio de integração vertical.

Avaliação geral

Com base na pontuação geral, ainda é prematuro esperar um mercado de futuros robusto de poder computacional.

Embora haja volatilidade atraente para especuladores e infraestrutura inicial de liquidação para facilitar negociações, falta fragmentação de oferta e padronização necessárias para uma descoberta de preços em larga escala.

A maior parte das negociações ocorre OTC.

Corretoras estão construindo fontes de preços, Ornn e Silicon Data estão lançando índices, e negociações em grupos de discussão estão sendo padronizadas em contratos modelo.

Embora isso seja significativo, ainda não é um mercado maduro como WTI ou PJM. O volume de negociações é pequeno, os contratos são altamente customizados e a oferta é concentrada demais, impedindo uma liquidação em grande escala pela infraestrutura existente.

A leitura correta desse quadro é usá-lo como uma ferramenta de diagnóstico, não como uma conclusão definitiva. Ele nos mostra o que falta, não o que é impossível.

Mistérios por resolver

O mercado evoluirá de maneiras que ainda não podemos prever com certeza.

Temos muitas incógnitas e algumas hipóteses preliminares. Essas hipóteses são exploratórias, requerendo validação ou refutação adicional. A seguir, apresentamos os argumentos mais fortes dessas hipóteses.

▍Nos próximos 1-2 anos, o fornecimento de mercado ficará mais fragmentado ou mais concentrado?

Esperamos uma fragmentação moderada.

Novos provedores de nuvem estão lançando novas capacidades mais rapidamente do que qualquer outro segmento.

Com a energia se tornando uma restrição central, novas regiões estão sendo ativadas, favorecendo operadores capazes de estabelecer capacidade perto de energia barata (não apenas perto de grandes centros de nuvem existentes).

Empresas do Fortune 2000 até apoiam pequenos data centers. Essa expansão parece inevitável.

No entanto, o modelo de negócios padrão depende de contratos de longo prazo com parceiros confiáveis (como grandes provedores de nuvem e laboratórios de ponta).

Serviços de nuvem como Hyperbolic e SF Compute oferecem capacidade sob demanda, por hora.

Essas empresas atendem startups de IA, aplicações de inferência em modelos de código aberto e laboratórios de pesquisa com orçamentos limitados, que têm demandas de poder computacional de cauda longa.

Acreditamos que a adoção de modelos de código aberto, especialmente, levará a uma maior fragmentação de capacidade — pois a oferta sairá de laboratórios de ponta e grandes provedores de nuvem, “desverticalizando” a oferta.

▍Como a padronização se desenvolverá?

Provedores de índices estão criando padrões para o custo por hora de instâncias de GPU.

Esses dados representam estimativas grosseiras, não preços exatos.

Os preços variam por fatores como região, configuração do hardware e prazo, dificultando a padronização de preços.

A diferenciação na configuração do hardware é especialmente pronunciada, resultado de data centers customizados para cargas de trabalho específicas e de otimizações feitas por grandes provedores de nuvem para manter a fidelidade do ecossistema, não para criar um mercado unificado.

Quando há uma demanda de mercado unificada, surgem padrões.

O padrão WTI foi adotado por servir a uma ampla gama de produtos downstream, como gasolina, diesel e querosene de aviação.

Hoje, a demanda por poder computacional é impulsionada por cargas de trabalho de treinamento e inferência de IA.

Infraestrutura de treinamento é altamente customizada, otimizada para tarefas de longa duração em instalações centralizadas, tornando as instâncias de poder quase não substituíveis.

Por outro lado, infraestrutura de inferência requer hardware mais simples e menor consumo de energia; ela é otimizada para baixa latência, com infraestrutura distribuída em diferentes regiões, não necessariamente no mesmo local.

A inferência é altamente homogênea, e espera-se que, até 2029, mais de 65% da demanda de poder computacional de IA seja para inferência. Acreditamos que melhorias na infraestrutura de poder para esse mercado levarão a uma maior padronização entre fornecedores.

Se ainda houver diferenças ao nível de chips, uma alternativa será a padronização por testes de hardware.

A Nvidia criou o benchmark MLPerf, que avalia o desempenho de inferência e treinamento de diversos modelos.

Sob essa abordagem, a negociação de instâncias de GPU não será baseada apenas nas especificações de hardware, mas na qualidade e eficiência do output.

▍O que pode impedir a padronização nos próximos 1-2 anos?

Acreditamos que “jardins murados” e cargas de trabalho altamente customizadas irão sufocar tentativas de padronização.

Nos próximos 1-2 anos, grandes provedores de nuvem e laboratórios de ponta irão lutar para manter seu domínio em infraestrutura de IA e fornecimento de modelos.

Se não se desacoplarem, manterão seus próprios hardwares de acordo com suas necessidades, dificultando a criação de padrões devido às diferentes demandas de cada um. A adoção de novas arquiteturas de chips também fragmentará ainda mais as especificações de hardware, dificultando a padronização.

▍Como os pesos de código aberto terão aplicações relevantes?

Este é o caminho mais simples para a formação do mercado de poder computacional.

Hoje, os principais obstáculos são a concentração da oferta e a falta de padronização.

A adoção ampla de pesos de código aberto democratiza a capacidade de executar inferência.

Isso cria incentivos para a formação de provedores independentes e promove a otimização de infraestrutura para esses modelos específicos.

Vemos uma história semelhante na mineração de Bitcoin: software de código aberto gerou muitos mineradores e impulsionou a padronização de hardware.

Até agora, pesos de código aberto têm ficado atrás de modelos fechados em desempenho.

Mas, se essa tendência continuar, eles logo alcançarão os limites de desempenho que hoje vemos em modelos fechados.

Empresas já estão integrando amplamente modelos fechados em seus sistemas, testemunhando aumentos significativos de produtividade. Em três meses, modelos que elevam a produtividade podem custar uma fração do que custam atualmente.

No entanto, a maioria das empresas ainda preferirá modelos de melhor desempenho.

Acreditamos que, um dia, modelos fechados de ponta se tornarão excessivamente caros para suas tarefas, levando as empresas a otimizar suas configurações entre diferentes modelos.

Lembre-se de que laboratórios de ponta atualmente oferecem inferência a preços abaixo do custo, pois precisam aumentar preços para manter operações. Quando isso acontecer, pesos de código aberto terão seu momento.

▍Qual será a unidade de precificação final das negociações?

O poder computacional pode ser aproximadamente decomposto em três camadas: chip, hora de instância de chip, Token.

Camada de chip — oferta altamente concentrada.

A ASML monopoliza as máquinas de litografia usadas pela TSMC, que por sua vez monopoliza as fábricas de chips da Nvidia, que monopoliza o design de chips de ponta.

Além disso, um chip só é útil se estiver conectado à energia e operando com alta disponibilidade. Isso nos leva a crer que um único chip entregável não será a unidade final de precificação.

Camada de hora de instância de chip — refere-se ao tempo efetivo de uso do chip.

Essa é a condição mais valiosa do chip e o núcleo da discussão aqui.

Nessa camada, enquanto houver demanda suficiente por recursos de poder computacional, ele se comportará como uma mercadoria, similar à energia elétrica.

Imaginamos que o poder será negociado de forma semelhante a energia e outros serviços públicos: com contratos regionais padronizados (poder como uma função da energia), complementados por mercados spot e futuros para hedge. Essa abordagem é viável na estrutura de “hora de instância de chip”.

Camada de Token — é o produto downstream da instância de poder computacional, podendo também ser a unidade final de precificação.

Se o Token for o principal driver das instâncias, o mercado de Token oferecerá uma forma de hedge para a demanda e permitirá que a oferta fixe receitas.

A oferta pode fazer hedge por meio de contratos de longo prazo ou integração vertical, mantendo concentração.

Por outro lado, Tokens não são padronizados entre modelos. Cada modelo tem sua própria segmentação de texto e produz saídas diferentes, tornando-os não totalmente intercambiáveis entre casos de uso. Ainda assim, estamos atentos ao desenvolvimento nesse campo.

BTC-1,95%
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado