«Акции, связанные с концепцией Nvidia» Интервью со соучредителем CoreWeave: спрос на ИИ, похоже, усиливается с каждым днем

Оригинальный заголовок: Интервью с руководителями CoreWeave: спрос на ИИ, кажется, «усиливается» с каждым днем
Автор оригинала: Tae Kim
Перевод: Peggy, BlockBeats

Примечание редактора: это интервью дает окно для наблюдения за циклом вычислительных мощностей ИИ: спрос не снизился после предыдущей волны ажиотажа GPU, а, наоборот, продолжает расти за счет интеллектуальных агентов, рассуждений и корпоративных ИИ-приложений.

В этой статье интервью взяли у соучредителя и главного директора по развитию CoreWeave Brannin McBee, а также вице-президента по развитию бизнеса и связям с инвесторами Nick Robbins, обсуждая текущую ситуацию с спросом на ИИ и рынком neocloud. Основные заявления руководства CoreWeave очень прямые — спрос на ИИ, кажется, каждый день усиливается новыми способами, а настоящие узкие места сместились с «наличия GPU» на более сложные инфраструктурные вопросы: электроснабжение дата-центров, CPU, хранение данных, электромонтаж, возможности цепочки поставок и готовность клиентов платить за новое поколение вычислительных мощностей.

Особенность CoreWeave в том, что он занимает промежуточное положение в цепочке инфраструктуры ИИ: обслуживает ведущих клиентов, таких как OpenAI, Anthropic, Meta, Google, Microsoft, Nvidia, а также напрямую ощущает изменения спроса со стороны исследовательских лабораторий, корпоративных клиентов и крупных облачных провайдеров. Поэтому он видит не только «недостаток GPU», но и структурные изменения в самом рабочем процессе ИИ. С ростом агентного ИИ и моделей рассуждений, потребность в вычислительных ресурсах больше не ограничивается GPU, важность CPU и хранения данных также возрастает, и новые дата-центры должны предусматривать пространство для Vera CPU, Vera Rubin серверов и расширенного хранения.

Это также объясняет, почему конкуренция за инфраструктуру ИИ переходит от простых закупок чипов к более комплексным инженерным решениям. Тот, кто быстрее получит электроснабжение дата-центров, развернет серверы, наладит цепочку поставок и оптимизирует стоимость каждого токена, — тот ближе к ядру этого цикла капиталовложений в ИИ. CoreWeave постоянно подчеркивает «ориентацию на клиента», что на самом деле отражает более широкое понимание: поставщики облачных решений ИИ уже не просто продают вычислительные мощности, а заранее перестраивают следующую генерацию ИИ-заводов в соответствии с дорожными картами своих передовых клиентов.

Для инвесторов и отраслевых наблюдателей самое важное в этом интервью — не отдельные цифры, а направление изменений в спросе на инфраструктуру ИИ: GPU по-прежнему важны, но узкие места расширяются; Nvidia остается ключевым игроком, но CPU, HBM, хранение данных и электроснабжение дата-центров становятся новыми переменными; спрос на ИИ продолжает расти, и исход будущего может зависеть от того, кто сможет постоянно, стабильно и масштабируемо поставлять сложную инфраструктуру.

Ниже — оригинальный текст:

CoreWeave считается одним из ранних лидеров рынка в области neocloud (новых облачных сервисов) с инновационным подходом.

Это единственный облачный провайдер, получивший высший «платиновый» рейтинг от исследовательской организации SemiAnalysis в области ИИ. CoreWeave был основан в 2017 году и предоставляет крупномасштабные GPU-вычисления для стартапов и крупных предприятий.

Ключевой контекст: недавно взято интервью у соучредителя и главного директора по развитию CoreWeave Brannin McBee и вице-президента по развитию бизнеса и связям с инвесторами Nick Robbins, обсуждая текущую ситуацию с спросом на ИИ и рынком neocloud.

Ниже — основные моменты из этой беседы после редакторской обработки:

Постоянное усиление спроса на ИИ

Tae: Когда началась волна спроса на интеллектуальных агентов ИИ?

Brannin: Мы увидели настоящий старт еще в четвертом квартале прошлого года. Тогда мы активно общались с клиентами по инженерным вопросам, обсуждая их продукты, которые планировали вывести на рынок в первом квартале этого года.

Это очень важная точка зрения для понимания потребностей клиентов. У нас существует глубокая инженерная связь с клиентами. Именно она позволяет нам заранее видеть тренды, а не реагировать пассивно после изменений.

Если смотреть с точки зрения продукта на рынке ИИ, я бы сказал, что первый квартал стал переломным моментом для рассуждений и потребления ИИ, и этот тренд продолжает ускоряться.

Tae: Как сейчас обстоят дела с спросом на ИИ? Нет ли признаков его снижения по сравнению с несколькими месяцами назад?

Nick: Кажется, что он усиливается каждый день новыми способами.

Tae: Расскажите о росте спроса на CPU по сравнению с GPU в волне интеллектуальных агентов. Планируете ли вы размещать ряды Vera CPU рядом с серверами Nvidia GPU?

Brannin: CoreWeave начал работать с CPU еще в 2023 году. У нас есть полноценный облачный продукт. Вопрос не в том, начинаем ли мы увеличивать число CPU, а в том, что именно требуется клиентам. Рост этого спроса в относительном выражении очень очевиден — он действительно есть.

По мере развития агентных и рассуждающих моделей, потребность в хранении данных также растет по сравнению с предыдущими поколениями. Я считаю, что эта тенденция продолжится.

Nick: На ваш вопрос — да, вы точно увидите, как Vera CPU активно размещаются рядом с Vera Rubin серверами. В прошлом году мы фактически полностью пересмотрели дизайн дата-центров, чтобы оставить больше места для хранения и CPU, чтобы их можно было разместить рядом с GPU.

Мы делали это потому, что находимся в очень уникальной позиции в экосистеме. Мы — единственный независимый облачный провайдер, обслуживающий всех ведущих технологических клиентов. Нет других независимых ИИ-облачных провайдеров, которые могли бы сказать, что их клиентами являются Anthropic, OpenAI, Meta, Google, Microsoft, Nvidia.

Это создает для нас положительный эффект — так называемый «положительный цикл»: мы понимаем, куда движутся технологии клиентов, и можем планировать развитие.

Узкие места больше не только GPU

Tae: В будущем вы планируете в основном использовать Vera CPU от Nvidia?

Nick: Это зависит от конкретных задач. Мы ориентируемся на потребности клиентов. Мы действительно ожидаем стать ранними и важными пользователями Vera CPU, об этом мы уже сообщали. Сейчас наши серверы в основном на AMD, но со временем ситуация может измениться в зависимости от требований клиентов. Интерес к Vera CPU очень высок.

Brannin: Это хорошая возможность напомнить, как у нас работают контракты. Как вы знаете, более 98% наших доходов — по контрактам. Мы не угадываем, что именно хотят клиенты в инфраструктуре. Они очень четко говорят, что им нужно. Всё — по требованию клиента. Он определяет, что мы строим.

Tae: Расскажите о конкуренции. Как вы входите на рынок и конкурируете с SpaceX, Nebius, Oracle в сфере neocloud и с Azure, AWS, Google — в сфере гигантских облаков?

Brannin: В плане дифференциации я предпочитаю смотреть с точки зрения сторонней оценки. За исключением Китая, девять из десяти ведущих ИИ-лабораторий мира используют нашу платформу. SemiAnalysis постоянно выделяет нас как лидера по производительности. Я не считаю, что наш успех в GPU-дистрибуции связан с личными связями с Jensen.

Это говорит о том, что поставщики очень доверяют нашим результатам и инженерным возможностям, веря, что мы лучше всего реализуем их продукты по всему миру.

Nick: Мы выигрываем у крупных облачных провайдеров благодаря отличной реализации. Мы можем очень быстро развернуть эти системы, и они работают отлично. Мы привлекаем исследовательские лаборатории, потому что предоставляем самые мощные технические решения и лучшие показатели эффективности на токен.

Для корпоративных клиентов мы выигрываем благодаря надежной инфраструктуре и превосходному оркестровочному слою, что подтверждается рейтингами, такими как платиновый.

Но все более важным становится то, что в сфере ИИ облачных решений мы создали самую зрелую платформу, охватывающую рассуждения и инструменты разработки, помогая компаниям внедрять ИИ в производство.

Это означает, что мы разрабатываем и поставляем продукты, которые помогают менее технологичным компаниям превращать данные в модели, а затем в умных агентов, и при этом можем кросс-продвигать облачные услуги CoreWeave.

Tae: Какие текущие узкие места? Уже ли есть электроснабжение в дата-центрах? GPU? Или электромонтаж?

Brannin: Это powered shells — дата-центры с электроснабжением. Точнее, компоненты внутри этих оболочек. Особенно важен электромонтаж — это очень сложная область.

Но главное — у нас уже запущено 49 таких объектов. Мы не надеемся на один-два, мы сделали 49.

Это очень сильный показатель исполнения.

Это также означает, что мы накопили много знаний о цепочке поставок, знаем, с какими поставщиками работать, а с какими — нет.

Примечание редактора: powered shells — это сами здания дата-центров, без серверного оборудования.

Tae: Что можете сказать о стоимости и дефиците HBM-памяти? Как вы с этим справляетесь? Должны ли клиенты нести расходы на рост цен?

Nick: Да, это так. Наша бизнес-модель предполагает, что при подписании заказа на GPU и определении стоимости мы фиксируем цену для клиента. В более широком смысле — это цена сервера, которая включает стоимость HBM.

Так мы изолируемся от ежедневных колебаний цен.

Если в следующей сделке стоимость компонентов вырастет, мы перенесем эти издержки в цену для клиента, чтобы сохранить прибыльность. Мы хорошо защищены от таких ценовых колебаний. Это очень важный аспект для нас.

На данный момент, получение компонентов — не самое большое ограничение. Самое узкое место — powered shell. Но в будущем ситуация может измениться.

Tae: Как вы видите развитие развертывания Vera Rubin? Что ожидаете во второй половине этого года?

Nick: Мы, безусловно, первые в мире запустили и полностью протестировали Vera Rubin — это наши шкафы VR. В прошлом году мы делали то же самое для GB200, GB300. Я ожидаю, что VR начнет появляться уже в конце этого года.

Я предполагаю, что масштабное и очень активное развертывание продолжится в 2027 году. Этот цикл похож на GB: он начался в 2025 году, а крупномасштабное развертывание — в 2026. То есть, в конце прошлого года было много внедрений, а в этом году — год масштабных запусков GB.

Я ожидаю, что в течение следующих 12–18 месяцев VR будет развиваться по очень похожему сценарию.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено