Ações relacionadas à Nvidia: Entrevista com cofundadores da CoreWeave: A demanda por IA parece estar aumentando a cada dia

Título original: Uma Entrevista com Executivos da CoreWeave: A Demanda por IA Parece se 'Intensificar' a Cada Dia
Autor original: Tae Kim
Tradução: Peggy, BlockBeats

Nota do editor: Esta entrevista oferece uma janela para observar o ciclo de capacidade de IA: a demanda não diminuiu após a última onda de compras de GPUs, mas continua sendo impulsionada por agentes inteligentes, raciocínio e aplicações corporativas de IA.

Este artigo entrevistou o cofundador e diretor de desenvolvimento da CoreWeave, Brannin McBee, e o vice-presidente de desenvolvimento corporativo e relações com investidores, Nick Robbins, discutindo o estado atual da demanda por IA e do mercado de neocloud. A declaração central dos executivos da CoreWeave é bastante direta — a demanda por IA parece estar se agravando de novas maneiras a cada dia, e os verdadeiros gargalos estão mudando de “existência de GPUs” para questões mais complexas de infraestrutura: fornecimento de energia para data centers, CPU, armazenamento, eletricidade, capacidade de execução da cadeia de suprimentos, e quanto os clientes estão dispostos a pagar pela nova geração de capacidade de processamento.

A particularidade da CoreWeave é que ela está posicionada no meio da cadeia de infraestrutura de IA: atendendo tanto clientes de ponta como OpenAI, Anthropic, Meta, Google, Microsoft, Nvidia, quanto percebendo diretamente as mudanças nas demandas de laboratórios de pesquisa, clientes empresariais e grandes provedores de nuvem. Portanto, ela não vê apenas “escassez de GPU”, mas uma mudança estrutural no próprio workload de IA. Com o surgimento de IA agentic e modelos de raciocínio, a demanda por capacidade de processamento não se limita mais às GPUs, mas também aumenta a importância de CPUs e armazenamento. O design de novos data centers deve reservar espaço para Vera CPU, Vera Rubin e mais armazenamento.

Isso também explica por que a competição por infraestrutura de IA está mudando de uma simples aquisição de chips para uma capacidade de entrega de engenharia mais abrangente. Quem conseguir obter energia, implantar servidores, integrar a cadeia de suprimentos e otimizar o custo por token mais rapidamente estará mais próximo do núcleo do ciclo de gastos de capital em IA. A CoreWeave enfatiza repetidamente “orientação ao cliente”, mas por trás disso há uma avaliação maior: provedores de nuvem de IA não vendem apenas capacidade de processamento, mas estão reestruturando antecipadamente a próxima geração de fábricas de IA de acordo com o roteiro dos clientes mais avançados.

Para investidores e observadores do setor, o mais importante nesta entrevista não é um número isolado, mas a direção das mudanças na demanda por infraestrutura de IA: GPUs ainda são importantes, mas os gargalos estão se espalhando; Nvidia continua sendo o núcleo, mas CPU, HBM, armazenamento e capacidade de fornecimento de energia para data centers estão se tornando novas variáveis; a demanda por IA continua crescendo, mas o sucesso futuro pode depender de quem conseguir entregar infraestrutura complexa de forma contínua, estável e em escala.

A seguir, o texto original:

A CoreWeave é vista como uma líder de mercado inovadora no campo de neocloud (serviços de nuvem de nova geração).

É a única provedora de nuvem a receber a classificação “platina” do SemiAnalysis, uma instituição de pesquisa de IA. Fundada em 2017, a CoreWeave fornece grande capacidade de GPU para startups e grandes empresas.

Contexto chave: Recentemente, entrevistamos o cofundador e diretor de desenvolvimento da CoreWeave, Brannin McBee, e o vice-presidente de desenvolvimento corporativo e relações com investidores, Nick Robbins, para discutir a demanda por IA e o mercado de neocloud.

A seguir, os principais pontos da conversa editada:

Demanda por IA continua a se intensificar

Tae: Quando começou a explosão na demanda por IA de agentes inteligentes?

Brannin: Começou no quarto trimestre do ano passado. Naquela época, estávamos em comunicação com clientes sobre aspectos de engenharia, discutindo produtos que eles planejavam lançar no primeiro trimestre deste ano.

Essa é uma perspectiva muito importante para entender a demanda dos clientes. Temos uma relação de engenharia profundamente interligada com eles. É essa relação que nos permite antecipar tendências, ao invés de reagir passivamente às mudanças após elas acontecerem.

Do ponto de vista de produtos do mercado de IA, diria que o primeiro trimestre marcou um ponto de inflexão na ascensão de raciocínio e consumo de IA, e essa aceleração continua até hoje.

Tae: Qual é o estado atual da demanda por IA? E, em comparação com alguns meses atrás, há sinais de desaceleração nas últimas semanas?

Nick: Parece que a demanda está se agravando de novas maneiras a cada dia.

Tae: Pode falar sobre a tendência de aumento na demanda por CPU em relação às GPUs na onda de IA de agentes? Vocês implantariam racks de Vera CPU ao lado de servidores Nvidia GPU?

Brannin: A CoreWeave já opera CPUs desde 2023. Sempre tivemos um produto de nuvem completo. Então, a questão não é se estamos começando a aumentar CPUs agora, mas sim o que os clientes realmente precisam. Essa demanda está crescendo de forma relativa? A resposta é muito clara — sim, de fato está.

À medida que agentes e raciocínio se tornam realmente relevantes nos modelos, a demanda por armazenamento também aumenta em relação às gerações anteriores. Acredito que essa tendência continuará.

Nick: Para sua pergunta, a resposta é sim. Você verá uma grande quantidade de Vera CPU sendo implantada ao lado de muitos servidores Vera Rubin. No ano passado, redesenhamos fundamentalmente a configuração de data centers para reservar mais espaço para armazenamento e CPUs, permitindo sua implantação ao lado de GPUs.

Fazemos isso porque estamos em uma posição muito única em todo o ecossistema. Somos o único provedor de nuvem independente que atende todos os principais usuários de tecnologia de ponta. Nenhum outro provedor de nuvem de IA independente pode dizer que Anthropic, OpenAI, Meta, Google, Microsoft, Nvidia são seus clientes.

Isso cria um ciclo virtuoso para nossos negócios, ou uma retroalimentação positiva: conseguimos entender para onde os clientes estão levando a tecnologia e planejar de acordo.

Gargalos não são mais apenas GPUs

Tae: No futuro, vocês usarão principalmente Vera CPU da Nvidia?

Nick: Depende da carga de trabalho específica. Nosso trabalho é impulsionado pela demanda dos clientes. De fato, esperamos ser early adopters importantes do Vera CPU, o que já divulgamos. Atualmente, nossos clusters são principalmente AMD, mas isso pode mudar com o tempo, dependendo das necessidades dos clientes. O interesse dos clientes na Vera CPU é muito forte.

Brannin: Isso também nos lembra de uma boa oportunidade para falar sobre como nossos contratos funcionam. Como você sabe, mais de 98% de nossa receita é baseada em contratos. Não estamos adivinhando o que os clientes querem em termos de infraestrutura. Eles nos dizem claramente o que precisam. Tudo é orientado pelo cliente. São eles que definem o que vamos construir.

Tae: Sobre o cenário competitivo. Como vocês entram no mercado e competem com SpaceX, Nebius, Oracle, e outros neocloud, além de gigantes como Azure, AWS e Google?

Brannin: Em termos de diferenciação, prefiro olhar sob a ótica de validação de terceiros. Fora da China, nove das dez principais laboratórios de IA do mundo usam nossa plataforma. O SemiAnalysis sempre nos destaca como o mais avançado em desempenho. Não acho que conseguimos essa alocação de GPU por causa de uma relação pessoal com Jensen.

Isso mostra que os fornecedores confiam muito na nossa capacidade de execução e engenharia, acreditando que podemos representar melhor suas capacidades de produto globalmente.

Nick: Nosso sucesso em conquistar clientes de grandes provedores de nuvem se deve à nossa excelente execução. Construímos esses sistemas muito rapidamente e eles funcionam muito bem. Para laboratórios de pesquisa, oferecemos as versões mais potentes de desempenho, com maior eficiência por token.

Para clientes empresariais, entregamos infraestrutura confiável e uma camada de orquestração de alta qualidade, reconhecida por certificações como a de platina.

Mas cada vez mais, no setor de provedores de nuvem de IA, construímos a camada de capacidade mais madura, cobrindo raciocínio e ferramentas de desenvolvimento, ajudando empresas a realmente colocar IA em produção.

Isso significa que estamos criando e entregando produtos que ajudam empresas com menor maturidade tecnológica a transformar dados em modelos, e esses modelos em agentes inteligentes que podem rodar internamente, enquanto também vendemos serviços de nuvem CoreWeave de forma cruzada.

Tae: Quais são os principais gargalos atualmente? São os data centers com fornecimento de energia? GPUs? Ou eletricidade?

Brannin: São os powered shells, ou seja, os data centers com fornecimento de energia. Mais precisamente, os componentes internos desses shells. Você mencionou eletricidade, e isso é totalmente correto. É uma área bastante complexa.

Mas o importante é que já temos 49 desses sites operando. Não estamos contando com um ou dois. Fizemos 49.

Essa é uma trajetória de execução muito sólida.

Isso também nos dá um grande conhecimento sobre como lidar com problemas na cadeia de suprimentos, quais fornecedores são confiáveis, quais não são.

Nota do editor: powered shells refere-se à estrutura física do data center, excluindo o hardware de servidores de computação.

Tae: Sobre o custo e a escassez de memória HBM, o que vocês podem compartilhar? Como vocês lidam com isso? Os clientes precisam arcar com o aumento de preço?

Nick: A resposta é sim. Nosso modelo de negócios é baseado em assinar pedidos de compra de GPU, fixando o custo que pagamos, e ao mesmo tempo, definir o preço que cobramos dos clientes por GPU. De forma mais ampla, isso inclui o preço do servidor, que obviamente incorpora o custo do HBM.

Essa é a forma que temos de isolar os efeitos das flutuações diárias de preço.

Se, em uma próxima compra, o custo dos componentes subir, repassamos esse aumento ao preço que podemos cobrar dos clientes, protegendo nossa margem de lucro. Estamos bem protegidos ao passar esses custos. Essa é uma preocupação que acompanhamos de perto.

Atualmente, adquirir componentes não é o maior gargalo. O maior gargalo é o powered shell. Mas, no futuro, essa resposta pode mudar.

Tae: Como vocês veem a evolução da implantação do Vera Rubin? Como será no segundo semestre?

Nick: Somos claramente a primeira empresa no mundo a lançar e validar completamente o VR, ou seja, o rack Vera Rubin. No ano passado, fizemos o mesmo com GB200 e GB300. Espero que o VR comece a aparecer no final deste ano.

Prevejo que uma grande e forte escalada de implantação ocorrerá ao longo de 2027. Esse ritmo será semelhante ao do GB: começou em 2025, mas a escalada real durou até 2026. Ou seja, no final do ano passado, já havia muitas implantações, mas 2027 será o ano de grande escala do GB.

Prevejo que, nos próximos 12 a 18 meses, o VR seguirá um ritmo muito semelhante.

Clique para conhecer as oportunidades na BlockBeats

Participe do grupo oficial da BlockBeats no Telegram:

Canal de assinatura: https://t.me/theblockbeats

Grupo de discussão: https://t.me/BlockBeats_App

Conta oficial no Twitter: https://twitter.com/BlockBeatsAsia

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado