1 июля Дилан Патель, основатель SemiAnalysis, в интервью подкасту Sequoia Capital "Training Data" заявил, что AI-инференс станет одним из крупнейших рынков в мире, потенциально превзойдя нефть и составив несколько процентных пунктов мирового ВВП. Он считает, что количество и ценность задач, выполняемых после каждой итерации модели, продолжают расширяться быстрее, чем рост вычислительной мощности, что указывает на возможный долгосрочный дефицит вычислительных мощностей. Патель прогнозирует, что к 2030 году совокупный спрос на вычислительную мощность только от OpenAI и Anthropic превысит 100 гигаватт; в ближайшие 3–5 лет влияние космических дата-центров останется незначительным, но к 2040 году более половины новых вычислительных мощностей может быть развернуто в космосе. Он указал, что основное ограничение заключается в стоимости наземной энергии и способности генерировать электричество. Как только экономика космического развертывания превзойдет наземные системы, миграция вычислительных мощностей в космос станет неизбежной. Что касается совместного проектирования аппаратного и программного обеспечения, Патель отметил, что рост эффективности AI за последние три года обусловлен не столько аппаратным обеспечением, сколько оптимизацией на уровне моделей и межслойной совместной оптимизацией. Он привел DeepSeek в качестве примера, заявив, что форма его экспертной модели специально оптимизирована для архитектуры Hopper от NVIDIA, что дает отличную производительность на Hopper, но плохую на TPU; модель Anthropic больше подходит для TPU, тогда как модель OpenAI тяготеет к пути GPU. Он считает, что так называемый ров CUDA связан не столько с самим CUDA, сколько с экосистемой открытых моделей, которые обычно оптимизируются вокруг сотрудничества с GPU. Патель также упомянул, что сильная поддержка генеральным директором NVIDIA Дженсеном Хуангом новых облачных компаний направлена на предотвращение монополизации рынка вычислительных мощностей крупными облачными провайдерами и содействие многополярному рынку. Кроме того, система бенчмаркинга реального времени InferenceX, созданная командой SemiAnalysis, показывает, что при эквивалентном качестве затраты на инференс снижаются примерно в 60 раз в год, а интеллект на ватт улучшается примерно в 40 раз.

DEEPSEEK5,11%

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .

Награда
лайк
комментарий
Репост
Поделиться

комментарий

Добавить комментарий

Нет комментариев

Популярные темы
Подробнее
#
gStocksTokenizedStocksLive
4,78M Популярность
#
StrongNonfarmPayrollsRekindleRateHikeFear
1,05M Популярность
#
IsraelStrikesIranBTCPlunges
68,2K Популярность
#
PredictWorldCupShare20000U
200,6K Популярность
#
ETHBreaks1700
152,57M Популярность

Закреплено

Карта сайта

Основатель SemiAnalysis: рынок AI-инференса может превзойти нефть и стать одним из крупнейших рынков в мире.

Популярные темы

gStocksTokenizedStocksLive

StrongNonfarmPayrollsRekindleRateHikeFear

IsraelStrikesIranBTCPlunges

PredictWorldCupShare20000U

ETHBreaks1700

Закреплено