Основатель SemiAnalysis: рынок AI-инференса может превзойти нефть и стать одним из крупнейших рынков в мире.

1 июля Дилан Патель, основатель SemiAnalysis, в интервью подкасту Sequoia Capital "Training Data" заявил, что AI-инференс станет одним из крупнейших рынков в мире, потенциально превзойдя нефть и составив несколько процентных пунктов мирового ВВП. Он считает, что количество и ценность задач, выполняемых после каждой итерации модели, продолжают расширяться быстрее, чем рост вычислительной мощности, что указывает на возможный долгосрочный дефицит вычислительных мощностей. Патель прогнозирует, что к 2030 году совокупный спрос на вычислительную мощность только от OpenAI и Anthropic превысит 100 гигаватт; в ближайшие 3–5 лет влияние космических дата-центров останется незначительным, но к 2040 году более половины новых вычислительных мощностей может быть развернуто в космосе. Он указал, что основное ограничение заключается в стоимости наземной энергии и способности генерировать электричество. Как только экономика космического развертывания превзойдет наземные системы, миграция вычислительных мощностей в космос станет неизбежной. Что касается совместного проектирования аппаратного и программного обеспечения, Патель отметил, что рост эффективности AI за последние три года обусловлен не столько аппаратным обеспечением, сколько оптимизацией на уровне моделей и межслойной совместной оптимизацией. Он привел DeepSeek в качестве примера, заявив, что форма его экспертной модели специально оптимизирована для архитектуры Hopper от NVIDIA, что дает отличную производительность на Hopper, но плохую на TPU; модель Anthropic больше подходит для TPU, тогда как модель OpenAI тяготеет к пути GPU. Он считает, что так называемый ров CUDA связан не столько с самим CUDA, сколько с экосистемой открытых моделей, которые обычно оптимизируются вокруг сотрудничества с GPU. Патель также упомянул, что сильная поддержка генеральным директором NVIDIA Дженсеном Хуангом новых облачных компаний направлена на предотвращение монополизации рынка вычислительных мощностей крупными облачными провайдерами и содействие многополярному рынку. Кроме того, система бенчмаркинга реального времени InferenceX, созданная командой SemiAnalysis, показывает, что при эквивалентном качестве затраты на инференс снижаются примерно в 60 раз в год, а интеллект на ватт улучшается примерно в 40 раз.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено