Основатель SemiAnalysis: Рынок ИИ-инференса может превысить нефтяной рынок и стать одним из крупнейших рынков в мире.

1 июля Дилан Патель, основатель SemiAnalysis, в интервью подкасту Sequoia Capital «Training Data» заявил, что AI-инференс станет одним из крупнейших рынков в мире, потенциально превзойдя нефть и составив несколько процентных пунктов мирового ВВП. Он считает, что количество и ценность задач, выполняемых после каждой итерации модели, продолжают расширяться темпами, опережающими рост вычислительной мощности, что предполагает возможный долгосрочный дефицит вычислительной мощности. Патель прогнозирует, что к 2030 году совокупный спрос на вычислительную мощность только OpenAI и Anthropic превысит 100 гигаватт; в ближайшие 3-5 лет влияние космических центров обработки данных останется незначительным, но к 2040 году более половины новых вычислительных мощностей могут быть размещены в космосе. Он указал, что ключевое ограничение заключается в стоимости наземной энергии и способности генерировать электроэнергию. Как только экономика космического развертывания превзойдет наземные системы, миграция вычислительных мощностей в космос станет неизбежной. Что касается совместного проектирования аппаратного и программного обеспечения, Патель отметил, что рост эффективности AI за последние три года был обусловлен в первую очередь не оборудованием, а оптимизацией на уровне моделей и межслойной коллаборацией. Он привел DeepSeek в качестве примера, заявив, что форма его экспертной модели специально оптимизирована для архитектуры Hopper от NVIDIA, что дает отличную производительность на Hopper, но плохую на TPU; модель Anthropic больше подходит для TPU, тогда как модель OpenAI тяготеет к GPU-направлению. Он считает, что так называемый «ров CUDA» — это не только сама CUDA, а скорее экосистема моделей с открытым исходным кодом, которая в целом оптимизируется вокруг коллаборации GPU. Патель также упомянул, что сильная поддержка генеральным директором NVIDIA Дженсеном Хуангом emerging облачных вычислительных компаний направлена на предотвращение монополизации ландшафта вычислительных мощностей крупными облачными провайдерами и продвижение мультиполярного рынка. Кроме того, система бенчмаркинга реального времени InferenceX, созданная командой SemiAnalysis, показывает, что при эквивалентном качестве затраты на инференс снизились примерно в 60 раз ежегодно, а интеллект на ватт улучшился примерно в 40 раз.
DEEPSEEK-0,85%
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено