「Ações relacionadas com a Nvidia」Entrevista com cofundador da CoreWeave: A procura por IA parece estar a aumentar a cada dia

Título original: Uma Entrevista com Executivos da CoreWeave: A Demanda por IA Parece se 'Intensificar' a Cada Dia
Autor original: Tae Kim
Tradução: Peggy, BlockBeats

Nota do editor: Esta entrevista oferece uma janela para observar o ciclo de capacidade de IA: a demanda não diminuiu após a última onda de compras de GPUs, mas continua sendo impulsionada por agentes inteligentes, raciocínio e aplicações de IA empresariais.

Este artigo entrevista o cofundador e diretor de desenvolvimento da CoreWeave, Brannin McBee, e o vice-presidente de desenvolvimento empresarial e relações com investidores, Nick Robbins, discutindo o estado atual da demanda por IA e do mercado de neocloud. A declaração central dos executivos da CoreWeave é bastante direta — a demanda por IA parece estar se agravando de novas formas a cada dia, e os verdadeiros gargalos estão mudando de "existência de GPUs" para questões mais complexas de infraestrutura: fornecimento de energia para data centers, CPU, armazenamento, eletricidade, capacidade de execução da cadeia de suprimentos, e quanto os clientes estão dispostos a pagar pela nova geração de capacidade de processamento.

A particularidade da CoreWeave reside no fato de estar posicionada na cadeia de infraestrutura de IA: atendendo tanto clientes de ponta como OpenAI, Anthropic, Meta, Google, Microsoft, Nvidia, quanto percebendo diretamente as mudanças de demanda de laboratórios de pesquisa, clientes empresariais e provedores de nuvem de grande escala. Portanto, o que ela observa não é apenas "escassez de GPU", mas uma mudança estrutural na carga de trabalho de IA em si. Com o surgimento de IA agentic e modelos de raciocínio, a demanda por capacidade de processamento não se limita mais às GPUs; a importância de CPUs e armazenamento também está crescendo, e o design de novos data centers deve reservar espaço para CPUs Vera, servidores Vera Rubin e mais armazenamento.

Isso também explica por que a competição por infraestrutura de IA está mudando de uma simples aquisição de chips para uma capacidade de entrega de engenharia mais abrangente. Quem conseguir obter mais rapidamente energia, implantar servidores, integrar a cadeia de suprimentos e otimizar o custo por token estará mais próximo do núcleo do ciclo de gastos de capital em IA. A CoreWeave enfatiza repetidamente a "orientação ao cliente", mas por trás disso há uma avaliação maior: provedores de nuvem de IA não vendem apenas capacidade de processamento, mas estão reestruturando antecipadamente a próxima geração de fábricas de IA de acordo com o roteiro dos clientes mais avançados.

Para investidores e observadores do setor, a parte mais importante desta entrevista não são números isolados, mas a direção das mudanças na demanda por infraestrutura de IA: GPUs continuam importantes, mas os gargalos estão se espalhando; Nvidia ainda é o núcleo, mas CPU, HBM, armazenamento e capacidade de fornecimento de energia para data centers estão se tornando novas variáveis; a demanda por IA continua crescendo, mas o sucesso futuro pode depender de quem conseguir entregar infraestrutura complexa de forma contínua, estável e em escala.

A seguir, o texto original:

A CoreWeave é vista como uma líder de mercado inovadora no campo de neocloud (novos serviços de nuvem).

É a única provedora de nuvem a receber a classificação "platina" máxima do SemiAnalysis, uma instituição de pesquisa de IA. Fundada em 2017, a CoreWeave fornece capacidade de GPU em grande escala para startups e grandes empresas.

Contexto chave: Recentemente, entrevistamos o cofundador e diretor de desenvolvimento da CoreWeave, Brannin McBee, e o vice-presidente de desenvolvimento empresarial e relações com investidores, Nick Robbins, para discutir a demanda por IA e o estado do mercado de neocloud.

A seguir, os principais pontos da conversa editada:

Demanda por IA continua a crescer

Tae: Quando começou a explosão na demanda por IA agentic?

Brannin: Começou realmente no quarto trimestre do ano passado. Naquela época, estávamos em comunicação com clientes sobre aspectos de engenharia, discutindo produtos que eles planejavam lançar no primeiro trimestre deste ano.

Essa é uma perspectiva muito importante para entender a demanda dos clientes. Temos uma relação de engenharia profundamente interligada com eles. Essa relação nos permite antecipar tendências, ao invés de reagir passivamente às mudanças após elas acontecerem.

Do ponto de vista de produtos do mercado de IA, diria que o primeiro trimestre marcou um ponto de inflexão na ascensão de raciocínio e consumo de IA, e essa aceleração continua até hoje.

Tae: Qual é o estado atual da demanda por IA? E, em comparação com alguns meses atrás, há sinais de desaceleração nas últimas semanas?

Nick: Parece que a demanda está se agravando de novas maneiras a cada dia.

Tae: Pode falar sobre o aumento na demanda por CPU em relação às GPUs na onda de IA agentic? Vocês implantariam racks de CPUs Vera ao lado de servidores GPU Nvidia?

Brannin: Desde 2023, a CoreWeave já opera com CPUs. Sempre tivemos um produto de nuvem completo. Então, a questão não é se estamos começando a aumentar CPUs agora, mas sim o que os clientes realmente precisam. Essa demanda está crescendo de forma relativa? A resposta é muito clara — sim, de fato está.

Com o crescimento de agentes e capacidades de raciocínio em modelos, a demanda por armazenamento também está aumentando em relação às gerações anteriores. Acredito que essa tendência continuará.

Nick: Para sua pergunta, a resposta é sim. Você verá muitas implantações de CPUs Vera ao lado de muitas servidores Vera Rubin. No ano passado, redesenhamos fundamentalmente a configuração de nossos data centers para reservar mais espaço para armazenamento e CPUs, permitindo sua implantação ao lado de GPUs.

Fazemos isso porque estamos em uma posição muito única no ecossistema. Somos o único provedor de nuvem independente atendendo todos os principais usuários de tecnologia. Nenhum outro provedor de nuvem de IA independente pode dizer que Anthropic, OpenAI, Meta, Google, Microsoft, Nvidia são seus clientes.

Isso cria um ciclo virtuoso para nossos negócios, ou uma retroalimentação positiva: conseguimos entender para onde os clientes estão levando a tecnologia e planejar de acordo.

Gargalos não são mais apenas GPUs

Tae: No futuro, vocês usarão principalmente CPUs Vera da Nvidia?

Nick: Depende da carga de trabalho específica. Nosso trabalho é impulsionado pela demanda do cliente. De fato, esperamos ser early adopters importantes de Vera CPU, o que já divulgamos. Atualmente, nossos clusters ainda são principalmente AMD, mas isso pode mudar com o tempo, dependendo das necessidades dos clientes. O interesse dos clientes na Vera CPU é muito forte.

Brannin: Isso também nos lembra bem de como nossos contratos funcionam. Como você sabe, mais de 98% de nossa receita é baseada em contratos. Não estamos adivinhando o que os clientes querem em termos de infraestrutura. Eles nos dizem claramente o que precisam. Tudo é orientado pelo cliente. São eles que definem o que vamos construir.

Tae: Sobre o cenário competitivo. Como vocês entram no mercado e competem com SpaceX, Nebius, Oracle, e outros neocloud, além de gigantes como Azure, AWS, Google?

Brannin: Em termos de diferenciação, prefiro olhar de uma perspectiva de validação de terceiros. Fora da China, nove das dez principais laboratórios de IA do mundo usam nossa plataforma. O SemiAnalysis sempre nos destaca como o mais alto em desempenho. Não acho que conseguimos essa alocação de GPUs por causa de uma relação pessoal com Jensen.

Isso mostra que os fornecedores têm muita confiança em nossa execução e capacidade de engenharia, acreditando que podemos representar melhor suas capacidades de produto globalmente.

Nick: Conseguimos conquistar clientes de provedores de nuvem de grande escala porque somos muito bons na execução. Podemos montar esses sistemas rapidamente e eles funcionam muito bem. Para laboratórios de pesquisa, conquistamos clientes porque oferecemos a versão mais potente de desempenho e a maior eficiência por token.

Conquistamos clientes empresariais porque nossa infraestrutura funciona bem e construímos uma camada de orquestração excelente, reconhecida por certificações como a de platina.

Mas cada vez mais, dentro do mercado de provedores de nuvem de IA, construímos a camada de capacidades mais madura, cobrindo raciocínio e ferramentas de desenvolvimento, ajudando empresas a realmente colocar IA em produção.

Isso significa que estamos construindo e entregando produtos que, no final, ajudam empresas com menor maturidade tecnológica a transformar dados em modelos, e esses modelos em agentes inteligentes que podem rodar internamente, enquanto também vendemos serviços de nuvem CoreWeave de forma cruzada.

Tae: Quais são os principais gargalos atualmente? Data centers com fornecimento de energia? GPUs? Ou eletricidade?

Brannin: São os powered shells, ou seja, os data centers com fornecimento de energia. Mais precisamente, os componentes internos desses shells. Você mencionou eletricidade, e isso é totalmente correto. É um campo bastante complexo.

Mas o importante é que já temos 49 desses sites operando. Não estamos contando com um ou dois. Fizemos 49 até agora.

Essa é uma trajetória de execução muito sólida.

Isso também nos dá um grande conhecimento de como lidar com problemas na cadeia de suprimentos, e quais fornecedores são adequados ou não para colaborar nesse setor.

Nota do editor: powered shells referem-se à estrutura física do data center, excluindo o hardware de servidores de computação propriamente dito.

Tae: Sobre o custo e a escassez de memória HBM, o que vocês podem compartilhar? Como vocês lidam com isso? Os clientes precisam arcar com o aumento de preços?

Nick: A resposta é sim. Nosso modelo de negócios é projetado para, ao assinar pedidos de compra de GPUs e determinar nossos custos, também fixar o preço que cobramos dos clientes por GPU. De forma mais ampla, isso inclui o preço do servidor, que obviamente incorpora o custo do HBM.

Essa é nossa forma de isolar os efeitos das flutuações diárias de preços.

Se, em uma próxima compra, nossos custos de componentes aumentarem, repassaremos esse aumento ao preço que podemos cobrar dos clientes, protegendo nossa margem de lucro. Estamos muito atentos a isso, e conseguimos repassar esses custos de forma eficaz.

Atualmente, adquirir componentes não é o maior gargalo. O maior gargalo é o powered shell. Mas, no futuro, essa resposta pode mudar.

Tae: Como vocês veem a escalada na implantação do Vera Rubin? Como será no segundo semestre?

Nick: Somos claramente a primeira empresa no mundo a lançar e validar completamente o Vera Rubin, ou seja, o rack VR. No ano passado, fizemos o mesmo com GB200 e GB300. Espero que o VR comece a aparecer no final deste ano.

Prevejo que uma grande e forte escalada de implantação ocorrerá ao longo de 2027. Esse ritmo será semelhante ao do GB: o GB começou a aparecer em 2025, mas a escalada real durou toda 2026. Ou seja, muitas implantações ocorreram no final de 2022, mas o grande volume só veio em 2026.

Prevejo que, nos próximos 12 a 18 meses, o VR seguirá um ritmo muito semelhante.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado