Вычислительные мощности слишком дефицитны! Арендная плата за H100, выпущенный NVIDIA четыре года назад, за последние полгода выросла почти на 40%

robot
Генерация тезисов в процессе

С наступлением нового года, на фоне того, что такие AI-киты, как Anthropic и ByteDance, продолжают выпускать хиты-приложения, а также с учетом «похмельного» ажиотажа, который усиливает всплеск спроса на использование открытых больших моделей, чипы NVIDIA H100 переживают яркий момент «V-образного» разворота цены на рынке аренды.

Нужно понимать, что это чип был представлен Хуан Жэньсюном на GTC в марте 2022 года, а поставки начались осенью того же года.

Согласно «Индексу цен на аренду H100 на срок в один год» от полупроводникового исследовательского института SemiAnalysis, который был опубликован в четверг, после того как «старый чип» достиг в октябре 2025 года цены 1,7 доллара за час, в этом марте аренда взлетела до 2,35 доллара в час за одну GPU, что означает рост почти на 40%**.

(Источник: SemiAnalysis)

Этот индекс построен на основе данных прямых опросов более чем 100 облачных провайдеров, покупателей и продавцов вычислительных мощностей; сбор проводится один раз в месяц.

Последний отчет указывает, что GPU-вычислительная мощность по модели on-demand уже распродана среди всех типов GPU — даже несмотря на недавний рост цен, клиенты, которые уже зафиксировали эти мощности через on-demand-инстансы, не хотят возвращать их в общий пул ресурсов. Исследовательский институт также метафорически сравнивает ситуацию с тем, как в начале 2026 года искать вычислительную мощность GPU — это как пытаться забронировать авиабилеты на «последний рейс, который вот-вот уйдет»: цена высока, а доступных ресурсов почти нет.

Исследователи добавляют: «Клиенты наперебой выкупают участвующие в аукционе инстансы p6-b200 от Amazon Web Services по цене 14 долларов за одну GPU в час; некоторые новые гиганты облачных сервисов (Neocloud Giants) уже даже перестали предлагать продажи с одного узла; часть GPU NVIDIA H100 по-прежнему продлевается по первоначальной цене, зафиксированной 2–3 года назад, а некоторые контракты на H100 и вовсе продлены до 2028 года».

А что насчет более продвинутых чипов Blackwell? Исследователи отмечают, что из-за сильного спроса на открыто-весовые модели и сохраняющегося всплеска требований к вычислениям для вывода (inference) сроки поставок новых Blackwell сейчас увеличились до 6–7 месяцев.

Во второй половине 2025 года рынок в какой-то момент ожидал, что по мере ускоренного развертывания Blackwell — более мощного и с более низкой стоимостью вычислений — аренда чипов Hopper (H100, H200) может существенно снизиться. Но текущая картина как раз обратная: спрос на H100 не только остается устойчивым, но в ряде случаев даже усиливается.

В отчете SemiAnalysis указано, что одним из ключевых драйверов спроса на вычислительные мощности в начале этого года является создание контента нативными медиасервисами. Например, Seedance (то есть Dream) от ByteDance и Nano Banana от Google стимулируют пользователей массово генерировать и оптимизировать видео/изображения, что приводит к значительному росту пропускной способности по токенам (token). Еще более заметный источник спроса — рост рабочих нагрузок многоагентных систем (multi-agent), которые обеспечивают параболический рост объема использования токенов и расхода вычислительных мощностей.

SemiAnalysis заявляет, что даже только они сами «за прошлую неделю потребили десятки миллиардов токенов», при этом стоимость на миллион токенов составляет около 5 долларов. Однако компания также удовлетворенно отмечает, что отдача — сэкономленное время и расширение рабочих процессов и возможностей — многократно превосходит затраты на вычислительные мощности.

Отчет также указывает, что динамика, при которой предложение вычислительных мощностей сжимается и цены растут, расходится с общими рыночными настроениями. Акции новых облачных сервис-провайдеров, таких как CoreWeave и Nebius, находятся на нижней границе диапазона последних 6–12 месяцев. Аналитики отмечают, что рынок по-прежнему придерживается нарратива в рамках сценария «в конечном счете возникнет перепроизводство предложения и вычислительные мощности станут товаром». Но реальность такова: в условиях агрессивной нехватки предложения почти все типы вычислительных ресурсов будут сохранять высокий спрос — независимо от того, чем различаются их относительные характеристики.

В будущем исследователи выделяют три ключевые точки наблюдения, чтобы понять, сохранится ли аренда GPU на высоком уровне.

Во-первых, по мере того как кластеры GB300 постепенно начнут набирать объем в течение всего 2026 года, рынок будет следить за тем, сможет ли дополнительное предложение действительно ослабить текущий дефицит вычислительных мощностей. Во-вторых, нужно наблюдать, ухудшается ли продолжающаяся нехватка чипов. И наконец, следует отслеживать расширение годового регулярного дохода (ARR) у всех крупнейших AI-компаний, а также темпы распространения AI-приложений и сохраняющийся темп устойчивого роста масштаба потребления токенов.

(Источник: Caixin)

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Горячее на Gate Fun

    Подробнее
  • РК:$2.22KДержатели:1
    0.00%
  • РК:$2.23KДержатели:1
    0.00%
  • РК:$2.23KДержатели:0
    0.00%
  • РК:$2.24KДержатели:2
    0.24%
  • РК:$2.23KДержатели:2
    0.00%
  • Закрепить