Qual é o maior obstáculo que restringe o desenvolvimento da inteligência artificial de IA? Tal como há alguns anos, a resposta poderia ter sido variada. Mas no momento em que prevalecem modelos grandes, só há uma resposta para essa pergunta - poder de computação insuficiente!
Ou, em outras palavras, os chips de computação AI dedicados da Nvidia não são suficientes.
Quem controla os chips de IA da Nvidia controla o futuro da IA.
Agora, existe uma empresa assim, que tem dezenas de milhares de "cartões de cálculo" de IA da Nvidia em suas mãos, e seus clientes incluem muitos gigantes da IA, como OpenAI e Microsoft.
Como um “escalador de poder de computação de IA”, esta empresa chamada CoreWeave avaliou a empresa em US$ 8 bilhões em 4 anos. Além de receber o investimento exclusivo da NVIDIA, a CoreWeave também usou seus chips NVIDIA como garantia para obter US$ 2,3 bilhões em financiamento de dívida de instituições importantes como Blackstone e Coatue.
Nada pode impedir a louca expansão da CoreWeave. Como ela lidou com a Nvidia, de uma empresa de "mineração" de criptomoedas a uma gigante de "infraestrutura de poder de computação" de IA?
01 De “cartão de mineração” para “cartão de contagem”
A equipe fundadora da CoreWeave consiste em três pessoas, nomeadamente Michael Intrator, Brian Venturo e Brannin McBee.Os três inicialmente trabalharam na área financeira e administraram fundos de hedge e escritórios familiares.
Quando eles ainda administravam fundos em Nova York, a mania da mineração de criptomoedas não havia diminuído. Inicialmente, apenas para ganhar uma renda extra, eles compraram a primeira GPU e depois compraram cada vez mais, e as mesas em Wall Street ficaram cheias de GPUs.
“Em 2016, compramos nossa primeira GPU, conectamos, colocamos na mesa de sinuca em nosso escritório em Manhattan, com vista para o East River, e extraímos o primeiro bloco da rede Ethereum. '”, Lembrou o CEO da CoreWeave, Michael Intrator, em um relatório de 2021. postagem no blog.
Logo, em 2017, eles transformaram oficialmente seu negócio paralelo em uma empresa.O nome da empresa estava inicialmente relacionado à criptomoeda e posteriormente foi alterado para CoreWeave. Quando decidiram se despedir de Wall Street, eles mudaram o hardware da GPU para uma garagem, assim como os figurões do Vale do Silício gostam de começar um negócio em uma garagem. No entanto, essa garagem não fica no Vale do Silício, na costa oeste, mas nos subúrbios. de Nova Jersey, na costa leste. Avô do homem.
Os três cofundadores da CoreWeave Michael Intrator (esquerda), Brian Venturo (meio) e Brannin McBee (direita)|CoreWeave
Na última década, a GPU tem sido um motor importante para o boom da criptomoeda e da tecnologia de inteligência artificial. No final de 2018, CoreWeave tornou-se um dos maiores mineradores de Ethereum na América do Norte, detendo mais de 50.000 GPUs, representando mais de 1% da rede Ethereum.
Nesse período, diversas pessoas também começaram a entender o desejo de outras empresas por recursos de GPU. Eles também percebem que não há vantagem competitiva duradoura no campo das criptomoedas porque o mercado é altamente competitivo e é grandemente afetado pelos preços da eletricidade.
Quando os preços das criptomoedas despencaram em 2018 e 2019, eles decidiram diversificar para outras áreas que eram mais estáveis, mas que também exigiam muita computação em GPU. Eles se concentram nas três principais áreas de inteligência artificial, entretenimento de mídia e ciências da vida** e, a partir de 2019, se concentrarão na compra de chipsets GPU de nível empresarial, na construção de infraestrutura em nuvem especializada e no ajuste de seus negócios em torno dos chips da Nvidia**.
À medida que o novo negócio está no caminho certo, o negócio de mineração Ethereum está gradualmente sendo marginalizado. A decisão de transformação provou ser correta e feliz: nenhum dos fundadores esperava a próxima onda de IA, que permitiu à CoreWeave expandir gradualmente de um pequeno escritório para centros de dados em todo o país para atender à demanda cada vez maior do mercado de IA.
Segundo um dos fundadores, em 2022, A receita da CoreWeave será de cerca de 30 milhões de dólares americanos, e deverá ultrapassar 500 milhões de dólares americanos em 2023, um aumento de mais de 10 vezes, e assinou contratos de quase 2 bilhões de dólares americanos. Este ano anunciou um investimento de 1,6 mil milhões de dólares em data centers no Texas, com planos de expansão para 14 data centers até ao final do ano.
02 AI "Rede Elétrica"
Apenas alguns anos após a criação do CoreWeave, as GPUs para IA se tornaram um dos ativos mais valiosos do mundo. Assim como Elon Musk e outros ridicularizados, agora é mais difícil comprar GPUs do que comprar medicamentos. À medida que a IA generativa impulsiona o mercado, a demanda por GPUs disparou e a CoreWeave está bem posicionada para fornecer às empresas de IA os recursos de que precisam.
Como provedora de serviços em nuvem, a CoreWeave fornece serviços de aluguel de recursos computacionais de alto desempenho, principalmente para clientes que precisam de muito poder computacional. O primeiro modelo é infraestrutura como serviço, alugando GPUs por hora. Os clientes só precisam pagar de acordo com o tempo de uso e a quantidade de recursos computacionais. Para pagar a taxa**, grandes clientes também contam com facilidades de customização. A bandeira é "35 vezes mais rápida que os provedores de nuvem tradicionais, custo 80% menor e latência 50% menor". A empresa se concentra em serviços de computação de alto desempenho, ao contrário dos provedores gerais de serviços em nuvem que também fornecem armazenamento, rede e outros serviços.
No ano passado, os executivos da CoreWeave compraram grandes quantidades dos chips mais recentes da Nvidia, assim como o Stable Diffusion e o Midjourney foram lançados. Mais tarde, quando viram o lançamento do ChatGPT, perceberam que tal investimento estava longe de ser suficiente: essas pessoas precisavam não apenas de milhares de GPUs, mas de milhões.
Eles descrevem o que a CoreWeave quer fazer como “construir uma rede de energia para o mercado de IA” e acreditam que “se essas coisas não forem construídas, a IA não será capaz de escalar”.
CoreWeave constrói novo data center no Texas | CoreWeave
Brannin McBee, diretor de estratégia da CoreWeave, disse em um podcast que no final do ano passado, todas as empresas de computação em hiperescala combinadas,** incluindo Amazon, Google, Microsoft, Oracle, incluindo CoreWeave, forneceram um total de cerca de 50 10.000 GPUs **, e até o final deste ano poderá estar perto de 1 milhão.
Em termos de taxa de crescimento da indústria e margens de lucro, ele acredita que a demanda do mercado de IA pode ser dividida em duas etapas: modelos de treinamento e execução de tarefas de inferência.Atualmente, há escassez de oferta de chips na fase de treinamento, ** enquanto a fase de inferência será o principal crescimento da demanda futura, é nesse ponto que reside a demanda real**.
Para um modelo de empresa de IA, após sair da fase de treinamento, a execução de inferências na fase de comercialização nos primeiros dois anos de lançamento do produto requer pelo menos um milhão de GPUs, mas a infraestrutura global de IA não é suficiente para atender a essa demanda. será um desafio de longo prazo e levará pelo menos mais dois anos antes que a escassez de fornecimento de GPU comece a diminuir.
Hoje, a maior parte do dinheiro investido no campo da IA tem que ir para a computação em nuvem. Em junho deste ano, a CNBC informou que a Microsoft “concordou em gastar potencialmente bilhões de dólares na infraestrutura de computação em nuvem da startup CoreWeave nos próximos anos”. Startups Star AI como a Inflection AI, que recentemente arrecadou US$ 1,3 bilhão em financiamento para construir enormes clusters de GPU, além disso, a escolha da empresa é CoreWeave.
03 Segure-se nas coxas da Nvidia
Em abril deste ano, CoreWeave concluiu um financiamento Série B de US$ 221 milhões, com investidores incluindo a fabricante de chips Nvidia, bem como o ex-CEO do GitHub, Nat Friedman, e o ex-executivo da Apple, Daniel Gross. Um mês depois, a empresa anunciou que havia recebido investimento adicional de US$ 200 milhões, elevando a rodada total de financiamento para US$ 421 milhões.
Em agosto, a CoreWeave garantiu outros US$ 2,3 bilhões em financiamento de dívida, oferecendo como garantia a tão procurada Nvidia H100. Os fundos serão usados para adquirir mais chips e construir mais data centers.
De acordo com as últimas notícias da Bloomberg, CoreWeave está atualmente se preparando para vender 10% de suas ações e a avaliação de sua empresa atingiu um máximo de US$ 8 bilhões.
O fundador da Nvidia, Jensen Huang, disse na teleconferência de resultados da empresa este ano: “Você verá um grande número de novos provedores de serviços em nuvem especializados em GPU.” “Um dos mais famosos é o CoreWeave, e eles estão fazendo um trabalho muito bom”.
O relacionamento da CoreWeave com a NVIDIA já começou em 2020. A empresa anunciou naquele ano que se juntaria ao programa de provedores de serviços em nuvem da NVIDIA Partner Network, com o objetivo principal de introduzir a aceleração de GPU na nuvem. Na recente Siggraph Computer Graphics Conference de 2023, Jen-Hsun Huang apareceu, e cada estande da CoreWeave foi especificamente marcado como “Powered by NVIDIA” em letras minúsculas.
Jensen Huang apareceu no stand da CoreWeave| CoreWeave
Incluindo Huang Renxun, os executivos da Nvidia não hesitaram em endossar o CoreWeave.
O Diretor Global de Desenvolvimento de Negócios Globais, Nuvem e Parceiros Estratégicos da NVIDIA chama a CoreWeave de "o primeiro provedor de soluções de computação em nuvem de elite na rede de parceiros NVIDIA. Eles oferecem aos clientes uma ampla gama de opções de computação, de A100 a A40, em um nível sem precedentes". , e fornecendo resultados de classe mundial em inteligência artificial, aprendizado de máquina, efeitos visuais e muito mais. NVIDIA está orgulhosa do CoreWeave." Outro executivo da NVIDIA posicionou-o no anúncio de financiamento como "o mais alto desempenho, o mais eficiente em termos energéticos plataforma de computação.”
Tais elogios também são relevantes para os próprios interesses da Nvidia. A Nvidia precisa garantir que seus usuários finais de computação possam acessar seus recursos computacionais com o mais alto desempenho possível, em escala, assim como os clientes desejam ter as mãos em novas gerações de chips assim que forem lançados. Isto também faz com que eles não hesitem em promover a sua cooperação com a CoreWeave, e não há mal nenhum em desenvolver uma "linha descendente" leal**.
A CoreWeave está sendo construída para atender aos padrões e requisitos da NVIDIA, operando em escala, colocando novas gerações de chips on-line poucos meses após seu lançamento, em vez dos trimestres que as empresas tradicionais de computação em hiperescala podem levar. Isso dá ao CoreWeave alto acesso dentro da NVIDIA.
“Como empresa, isso nos dá confiança aos olhos da NVIDIA porque eles sabem que nossa infraestrutura será entregue aos clientes mais rapidamente do que qualquer outra no mercado e nas configurações de mais alto desempenho”, disse Brannin McBee.
04 Gigantes do Vale do Silício
No entanto, como o CoreWeave se sai diante da concorrência dos gigantes do Vale do Silício?
Do ponto de vista da indústria, Os concorrentes da CoreWeave em operações de infraestrutura de IA incluem gigantes da tecnologia como Microsoft, Google e Amazon.
No final de agosto, o CEO do Google Cloud, Thomas Kurian, disse na conferência anual Next que atualmente mais de 50% das startups de IA na indústria e mais de 70% dos unicórnios de IA generativos são clientes do Google Cloud.
Como pode uma empresa start-up com uma avaliação de 8 mil milhões de dólares evitar ser esmagada por um bando de gigantes com biliões de dólares americanos? A resposta actual reside na flexibilidade e no foco empresarial das próprias pequenas empresas, bem como no sensível panorama estratégico entre as empresas tecnológicas.
Os executivos da CoreWeave gostam de fazer uma analogia: "A General Motors pode construir um carro elétrico, mas isso não significa que ele se tornará um Tesla." Eles acreditam que A IA apresenta desafios que as plataformas de nuvem tradicionais não conseguem lidar, permitindo que a empresa emergente tenha um vantagem sobre jogadores estabelecidos forçados a se adaptar.
Gigantes do Vale do Silício, como Amazon, Google e Microsoft, são como porta-aviões, exigindo mais tempo e espaço sempre que ajustam a direção. Na sua opinião, eles precisam de tempo para se adaptarem à nova forma de construir infra-estruturas de IA, e normalmente demora algum tempo após o lançamento do chip mais recente para fornecer acesso em grande escala. Agora as pessoas estão prestando mais atenção à construção de supercomputadores, que exigem tarefas altamente colaborativas entre esses computadores e maior rendimento de dados, mas os principais recursos dos gigantes não são usados aqui.
“Quando esses três gigantes construíram seus serviços em nuvem, eles estavam servindo centenas de milhares, senão milhões, dos chamados casos de uso de uso geral em sua base de usuários, onde poderia haver apenas uma fração dessa capacidade dedicada à GPU. computação”, disse Brian Venturo, diretor de tecnologia da CoreWeave.
A CoreWeave acredita que sua flexibilidade e profissionalismo permitem que ela se destaque no campo da infraestrutura de IA, tenha vantagens competitivas em desempenho e custo-benefício e seja mais adequada para aplicações de IA. A CoreWeave tem pouco mais de 200 funcionários e mais clientes do que funcionários, mas fechou acordos com a Inflection AI e até mesmo com a Microsoft, patrocinadora da OpenAI, para fornecer sistemas e chips personalizados com mais configurações do que as equipadas para computação de uso geral. Os servidores são mais eficientes**.
Atualmente em termos de escala, CoreWeave afirma ter mais de 45.000 GPUs Nvidia de última geração que podem ser usadas sob demanda. Não é apenas a quantidade que importa, é o acesso fornecido. Quando se trata de seleção, CoreWeave afirma manter a mais ampla seleção de GPUs Nvidia do setor para uma variedade de necessidades de computação. Eles projetam sistemas para cargas de trabalho do “tamanho certo”, alegando “nem mais nem menos: apenas certo”.
Quanto ao preço, a bandeira da CoreWeave é “80% mais barata que os concorrentes”.
Por outro lado, a tomada de decisão da Nvidia por trás disso também é crítica. Ao controlar os escassos recursos da GPU e escolher de quem comprar os produtos, isso também afetará todo o mercado. Apesar da oferta restrita, a Nvidia alocou um grande número dos mais recentes chips de IA para CoreWeave, desviando o fornecimento dos principais provedores de serviços em nuvem, incluindo AWS. A razão é que essas empresas estão tentando desenvolver seus próprios chips de IA para reduzir sua dependência da Nvidia.
Os executivos da CoreWeave consideram que “não fabricar seus próprios chips definitivamente não é uma desvantagem” porque os ajudará a lutar por mais GPUs da Nvidia. Afinal, eles não têm conflito de interesses com a Nvidia, o que pode não ser o caso com os apetites vorazes do Vale do Silício.
No entanto, afinal, a gigante da tecnologia ainda é uma grande cliente da Nvidia. No final de agosto deste ano, Huang Renxun apareceu na conferência anual Next do Google Cloud e anunciou uma nova cooperação com o Google.O supercomputador GPU A3 VM do Google será lançado no mercado em setembro, equipado com GPU H100 da Nvidia.
Na conferência Google Cloud Next2023, Huang Renxun apareceu para anunciar a cooperação com Google Cloud|Google Cloud
Além disso, se aparecer de repente um novo chip que possa ter um desempenho melhor ou tão bom quanto o da Nvidia, o que isso afetará os negócios da CoreWeave?
Brannin McBee acredita que a vida útil do mesmo chip inclui os primeiros dois a três anos para treinamento de modelo e depois quatro a cinco anos para execução de inferência, e não há muito risco no curto prazo. Além disso, a Nvidia está trabalhando duro para construir um ecossistema aberto em torno de seu hardware para aumentar a aderência da indústria à sua tecnologia de chips.Outros fabricantes estão obviamente muito motivados para entrar neste campo, mas carecem de um ecossistema, que é uma lacuna que não pode ser ignorada.
Na ausência de tecnologia de fabricação de chips hard-core, as vantagens relativas e o sucesso do CoreWeave estão firmemente ligados à cadeia de suprimentos e à estabilidade de seus parceiros.Quando a GPU para todo o setor está em falta, essa dependência ainda é uma vantagem.
Da "mina" de criptomoeda à "mina de poder de computação" de inteligência artificial, a história de sucesso da CoreWeave é impressionante - um grão de ouro na época pode fazer uma empresa iniciante crescer rapidamente, mesmo que caia sobre ela. Nesta era de rápido crescimento da IA, o desejo da indústria por poder computacional criou a empresa Nvidia, de um trilhão de dólares, e obviamente também criou empresas como a CoreWeave, que podem aproveitar a oportunidade e apostar tudo.
Ver original
O conteúdo serve apenas de referência e não constitui uma solicitação ou oferta. Não é prestado qualquer aconselhamento em matéria de investimento, fiscal ou jurídica. Consulte a Declaração de exoneração de responsabilidade para obter mais informações sobre os riscos.
A NVIDIA apoia fortemente este “escalador de poder de computação de IA” com uma avaliação de 56 bilhões em 4 anos
Qual é o maior obstáculo que restringe o desenvolvimento da inteligência artificial de IA? Tal como há alguns anos, a resposta poderia ter sido variada. Mas no momento em que prevalecem modelos grandes, só há uma resposta para essa pergunta - poder de computação insuficiente!
Ou, em outras palavras, os chips de computação AI dedicados da Nvidia não são suficientes.
Quem controla os chips de IA da Nvidia controla o futuro da IA.
Agora, existe uma empresa assim, que tem dezenas de milhares de "cartões de cálculo" de IA da Nvidia em suas mãos, e seus clientes incluem muitos gigantes da IA, como OpenAI e Microsoft.
Como um “escalador de poder de computação de IA”, esta empresa chamada CoreWeave avaliou a empresa em US$ 8 bilhões em 4 anos. Além de receber o investimento exclusivo da NVIDIA, a CoreWeave também usou seus chips NVIDIA como garantia para obter US$ 2,3 bilhões em financiamento de dívida de instituições importantes como Blackstone e Coatue.
Nada pode impedir a louca expansão da CoreWeave. Como ela lidou com a Nvidia, de uma empresa de "mineração" de criptomoedas a uma gigante de "infraestrutura de poder de computação" de IA?
01 De “cartão de mineração” para “cartão de contagem”
A equipe fundadora da CoreWeave consiste em três pessoas, nomeadamente Michael Intrator, Brian Venturo e Brannin McBee.Os três inicialmente trabalharam na área financeira e administraram fundos de hedge e escritórios familiares.
Quando eles ainda administravam fundos em Nova York, a mania da mineração de criptomoedas não havia diminuído. Inicialmente, apenas para ganhar uma renda extra, eles compraram a primeira GPU e depois compraram cada vez mais, e as mesas em Wall Street ficaram cheias de GPUs.
“Em 2016, compramos nossa primeira GPU, conectamos, colocamos na mesa de sinuca em nosso escritório em Manhattan, com vista para o East River, e extraímos o primeiro bloco da rede Ethereum. '”, Lembrou o CEO da CoreWeave, Michael Intrator, em um relatório de 2021. postagem no blog.
Logo, em 2017, eles transformaram oficialmente seu negócio paralelo em uma empresa.O nome da empresa estava inicialmente relacionado à criptomoeda e posteriormente foi alterado para CoreWeave. Quando decidiram se despedir de Wall Street, eles mudaram o hardware da GPU para uma garagem, assim como os figurões do Vale do Silício gostam de começar um negócio em uma garagem. No entanto, essa garagem não fica no Vale do Silício, na costa oeste, mas nos subúrbios. de Nova Jersey, na costa leste. Avô do homem.
Na última década, a GPU tem sido um motor importante para o boom da criptomoeda e da tecnologia de inteligência artificial. No final de 2018, CoreWeave tornou-se um dos maiores mineradores de Ethereum na América do Norte, detendo mais de 50.000 GPUs, representando mais de 1% da rede Ethereum.
Nesse período, diversas pessoas também começaram a entender o desejo de outras empresas por recursos de GPU. Eles também percebem que não há vantagem competitiva duradoura no campo das criptomoedas porque o mercado é altamente competitivo e é grandemente afetado pelos preços da eletricidade.
Quando os preços das criptomoedas despencaram em 2018 e 2019, eles decidiram diversificar para outras áreas que eram mais estáveis, mas que também exigiam muita computação em GPU. Eles se concentram nas três principais áreas de inteligência artificial, entretenimento de mídia e ciências da vida** e, a partir de 2019, se concentrarão na compra de chipsets GPU de nível empresarial, na construção de infraestrutura em nuvem especializada e no ajuste de seus negócios em torno dos chips da Nvidia**.
À medida que o novo negócio está no caminho certo, o negócio de mineração Ethereum está gradualmente sendo marginalizado. A decisão de transformação provou ser correta e feliz: nenhum dos fundadores esperava a próxima onda de IA, que permitiu à CoreWeave expandir gradualmente de um pequeno escritório para centros de dados em todo o país para atender à demanda cada vez maior do mercado de IA.
Segundo um dos fundadores, em 2022, A receita da CoreWeave será de cerca de 30 milhões de dólares americanos, e deverá ultrapassar 500 milhões de dólares americanos em 2023, um aumento de mais de 10 vezes, e assinou contratos de quase 2 bilhões de dólares americanos. Este ano anunciou um investimento de 1,6 mil milhões de dólares em data centers no Texas, com planos de expansão para 14 data centers até ao final do ano.
02 AI "Rede Elétrica"
Apenas alguns anos após a criação do CoreWeave, as GPUs para IA se tornaram um dos ativos mais valiosos do mundo. Assim como Elon Musk e outros ridicularizados, agora é mais difícil comprar GPUs do que comprar medicamentos. À medida que a IA generativa impulsiona o mercado, a demanda por GPUs disparou e a CoreWeave está bem posicionada para fornecer às empresas de IA os recursos de que precisam.
Como provedora de serviços em nuvem, a CoreWeave fornece serviços de aluguel de recursos computacionais de alto desempenho, principalmente para clientes que precisam de muito poder computacional. O primeiro modelo é infraestrutura como serviço, alugando GPUs por hora. Os clientes só precisam pagar de acordo com o tempo de uso e a quantidade de recursos computacionais. Para pagar a taxa**, grandes clientes também contam com facilidades de customização. A bandeira é "35 vezes mais rápida que os provedores de nuvem tradicionais, custo 80% menor e latência 50% menor". A empresa se concentra em serviços de computação de alto desempenho, ao contrário dos provedores gerais de serviços em nuvem que também fornecem armazenamento, rede e outros serviços.
No ano passado, os executivos da CoreWeave compraram grandes quantidades dos chips mais recentes da Nvidia, assim como o Stable Diffusion e o Midjourney foram lançados. Mais tarde, quando viram o lançamento do ChatGPT, perceberam que tal investimento estava longe de ser suficiente: essas pessoas precisavam não apenas de milhares de GPUs, mas de milhões.
Eles descrevem o que a CoreWeave quer fazer como “construir uma rede de energia para o mercado de IA” e acreditam que “se essas coisas não forem construídas, a IA não será capaz de escalar”.
Brannin McBee, diretor de estratégia da CoreWeave, disse em um podcast que no final do ano passado, todas as empresas de computação em hiperescala combinadas,** incluindo Amazon, Google, Microsoft, Oracle, incluindo CoreWeave, forneceram um total de cerca de 50 10.000 GPUs **, e até o final deste ano poderá estar perto de 1 milhão.
Em termos de taxa de crescimento da indústria e margens de lucro, ele acredita que a demanda do mercado de IA pode ser dividida em duas etapas: modelos de treinamento e execução de tarefas de inferência.Atualmente, há escassez de oferta de chips na fase de treinamento, ** enquanto a fase de inferência será o principal crescimento da demanda futura, é nesse ponto que reside a demanda real**.
Para um modelo de empresa de IA, após sair da fase de treinamento, a execução de inferências na fase de comercialização nos primeiros dois anos de lançamento do produto requer pelo menos um milhão de GPUs, mas a infraestrutura global de IA não é suficiente para atender a essa demanda. será um desafio de longo prazo e levará pelo menos mais dois anos antes que a escassez de fornecimento de GPU comece a diminuir.
Hoje, a maior parte do dinheiro investido no campo da IA tem que ir para a computação em nuvem. Em junho deste ano, a CNBC informou que a Microsoft “concordou em gastar potencialmente bilhões de dólares na infraestrutura de computação em nuvem da startup CoreWeave nos próximos anos”. Startups Star AI como a Inflection AI, que recentemente arrecadou US$ 1,3 bilhão em financiamento para construir enormes clusters de GPU, além disso, a escolha da empresa é CoreWeave.
03 Segure-se nas coxas da Nvidia
Em abril deste ano, CoreWeave concluiu um financiamento Série B de US$ 221 milhões, com investidores incluindo a fabricante de chips Nvidia, bem como o ex-CEO do GitHub, Nat Friedman, e o ex-executivo da Apple, Daniel Gross. Um mês depois, a empresa anunciou que havia recebido investimento adicional de US$ 200 milhões, elevando a rodada total de financiamento para US$ 421 milhões.
Em agosto, a CoreWeave garantiu outros US$ 2,3 bilhões em financiamento de dívida, oferecendo como garantia a tão procurada Nvidia H100. Os fundos serão usados para adquirir mais chips e construir mais data centers.
De acordo com as últimas notícias da Bloomberg, CoreWeave está atualmente se preparando para vender 10% de suas ações e a avaliação de sua empresa atingiu um máximo de US$ 8 bilhões.
O fundador da Nvidia, Jensen Huang, disse na teleconferência de resultados da empresa este ano: “Você verá um grande número de novos provedores de serviços em nuvem especializados em GPU.” “Um dos mais famosos é o CoreWeave, e eles estão fazendo um trabalho muito bom”.
O relacionamento da CoreWeave com a NVIDIA já começou em 2020. A empresa anunciou naquele ano que se juntaria ao programa de provedores de serviços em nuvem da NVIDIA Partner Network, com o objetivo principal de introduzir a aceleração de GPU na nuvem. Na recente Siggraph Computer Graphics Conference de 2023, Jen-Hsun Huang apareceu, e cada estande da CoreWeave foi especificamente marcado como “Powered by NVIDIA” em letras minúsculas.
Incluindo Huang Renxun, os executivos da Nvidia não hesitaram em endossar o CoreWeave.
O Diretor Global de Desenvolvimento de Negócios Globais, Nuvem e Parceiros Estratégicos da NVIDIA chama a CoreWeave de "o primeiro provedor de soluções de computação em nuvem de elite na rede de parceiros NVIDIA. Eles oferecem aos clientes uma ampla gama de opções de computação, de A100 a A40, em um nível sem precedentes". , e fornecendo resultados de classe mundial em inteligência artificial, aprendizado de máquina, efeitos visuais e muito mais. NVIDIA está orgulhosa do CoreWeave." Outro executivo da NVIDIA posicionou-o no anúncio de financiamento como "o mais alto desempenho, o mais eficiente em termos energéticos plataforma de computação.”
Tais elogios também são relevantes para os próprios interesses da Nvidia. A Nvidia precisa garantir que seus usuários finais de computação possam acessar seus recursos computacionais com o mais alto desempenho possível, em escala, assim como os clientes desejam ter as mãos em novas gerações de chips assim que forem lançados. Isto também faz com que eles não hesitem em promover a sua cooperação com a CoreWeave, e não há mal nenhum em desenvolver uma "linha descendente" leal**.
A CoreWeave está sendo construída para atender aos padrões e requisitos da NVIDIA, operando em escala, colocando novas gerações de chips on-line poucos meses após seu lançamento, em vez dos trimestres que as empresas tradicionais de computação em hiperescala podem levar. Isso dá ao CoreWeave alto acesso dentro da NVIDIA.
“Como empresa, isso nos dá confiança aos olhos da NVIDIA porque eles sabem que nossa infraestrutura será entregue aos clientes mais rapidamente do que qualquer outra no mercado e nas configurações de mais alto desempenho”, disse Brannin McBee.
04 Gigantes do Vale do Silício
No entanto, como o CoreWeave se sai diante da concorrência dos gigantes do Vale do Silício?
Do ponto de vista da indústria, Os concorrentes da CoreWeave em operações de infraestrutura de IA incluem gigantes da tecnologia como Microsoft, Google e Amazon.
No final de agosto, o CEO do Google Cloud, Thomas Kurian, disse na conferência anual Next que atualmente mais de 50% das startups de IA na indústria e mais de 70% dos unicórnios de IA generativos são clientes do Google Cloud.
Como pode uma empresa start-up com uma avaliação de 8 mil milhões de dólares evitar ser esmagada por um bando de gigantes com biliões de dólares americanos? A resposta actual reside na flexibilidade e no foco empresarial das próprias pequenas empresas, bem como no sensível panorama estratégico entre as empresas tecnológicas.
Os executivos da CoreWeave gostam de fazer uma analogia: "A General Motors pode construir um carro elétrico, mas isso não significa que ele se tornará um Tesla." Eles acreditam que A IA apresenta desafios que as plataformas de nuvem tradicionais não conseguem lidar, permitindo que a empresa emergente tenha um vantagem sobre jogadores estabelecidos forçados a se adaptar.
Gigantes do Vale do Silício, como Amazon, Google e Microsoft, são como porta-aviões, exigindo mais tempo e espaço sempre que ajustam a direção. Na sua opinião, eles precisam de tempo para se adaptarem à nova forma de construir infra-estruturas de IA, e normalmente demora algum tempo após o lançamento do chip mais recente para fornecer acesso em grande escala. Agora as pessoas estão prestando mais atenção à construção de supercomputadores, que exigem tarefas altamente colaborativas entre esses computadores e maior rendimento de dados, mas os principais recursos dos gigantes não são usados aqui.
“Quando esses três gigantes construíram seus serviços em nuvem, eles estavam servindo centenas de milhares, senão milhões, dos chamados casos de uso de uso geral em sua base de usuários, onde poderia haver apenas uma fração dessa capacidade dedicada à GPU. computação”, disse Brian Venturo, diretor de tecnologia da CoreWeave.
A CoreWeave acredita que sua flexibilidade e profissionalismo permitem que ela se destaque no campo da infraestrutura de IA, tenha vantagens competitivas em desempenho e custo-benefício e seja mais adequada para aplicações de IA. A CoreWeave tem pouco mais de 200 funcionários e mais clientes do que funcionários, mas fechou acordos com a Inflection AI e até mesmo com a Microsoft, patrocinadora da OpenAI, para fornecer sistemas e chips personalizados com mais configurações do que as equipadas para computação de uso geral. Os servidores são mais eficientes**.
Atualmente em termos de escala, CoreWeave afirma ter mais de 45.000 GPUs Nvidia de última geração que podem ser usadas sob demanda. Não é apenas a quantidade que importa, é o acesso fornecido. Quando se trata de seleção, CoreWeave afirma manter a mais ampla seleção de GPUs Nvidia do setor para uma variedade de necessidades de computação. Eles projetam sistemas para cargas de trabalho do “tamanho certo”, alegando “nem mais nem menos: apenas certo”.
Quanto ao preço, a bandeira da CoreWeave é “80% mais barata que os concorrentes”.
Por outro lado, a tomada de decisão da Nvidia por trás disso também é crítica. Ao controlar os escassos recursos da GPU e escolher de quem comprar os produtos, isso também afetará todo o mercado. Apesar da oferta restrita, a Nvidia alocou um grande número dos mais recentes chips de IA para CoreWeave, desviando o fornecimento dos principais provedores de serviços em nuvem, incluindo AWS. A razão é que essas empresas estão tentando desenvolver seus próprios chips de IA para reduzir sua dependência da Nvidia.
Os executivos da CoreWeave consideram que “não fabricar seus próprios chips definitivamente não é uma desvantagem” porque os ajudará a lutar por mais GPUs da Nvidia. Afinal, eles não têm conflito de interesses com a Nvidia, o que pode não ser o caso com os apetites vorazes do Vale do Silício.
No entanto, afinal, a gigante da tecnologia ainda é uma grande cliente da Nvidia. No final de agosto deste ano, Huang Renxun apareceu na conferência anual Next do Google Cloud e anunciou uma nova cooperação com o Google.O supercomputador GPU A3 VM do Google será lançado no mercado em setembro, equipado com GPU H100 da Nvidia.
Além disso, se aparecer de repente um novo chip que possa ter um desempenho melhor ou tão bom quanto o da Nvidia, o que isso afetará os negócios da CoreWeave?
Brannin McBee acredita que a vida útil do mesmo chip inclui os primeiros dois a três anos para treinamento de modelo e depois quatro a cinco anos para execução de inferência, e não há muito risco no curto prazo. Além disso, a Nvidia está trabalhando duro para construir um ecossistema aberto em torno de seu hardware para aumentar a aderência da indústria à sua tecnologia de chips.Outros fabricantes estão obviamente muito motivados para entrar neste campo, mas carecem de um ecossistema, que é uma lacuna que não pode ser ignorada.
Na ausência de tecnologia de fabricação de chips hard-core, as vantagens relativas e o sucesso do CoreWeave estão firmemente ligados à cadeia de suprimentos e à estabilidade de seus parceiros.Quando a GPU para todo o setor está em falta, essa dependência ainda é uma vantagem.
Da "mina" de criptomoeda à "mina de poder de computação" de inteligência artificial, a história de sucesso da CoreWeave é impressionante - um grão de ouro na época pode fazer uma empresa iniciante crescer rapidamente, mesmo que caia sobre ela. Nesta era de rápido crescimento da IA, o desejo da indústria por poder computacional criou a empresa Nvidia, de um trilhão de dólares, e obviamente também criou empresas como a CoreWeave, que podem aproveitar a oportunidade e apostar tudo.