Обчислювальна потужність надто затребувана! Вартість оренди H100, випущеного NVIDIA чотири роки тому, за останні шість місяців зросла майже на 40%

robot
Генерація анотацій у процесі

З настанням нового року, коли такі AI-гіганти, як Anthropic і ByteDance, безперервно випускають хітові застосунки, на додачу до «хвостоподібної» хвилі, що підштовхує різке зростання попиту на виклик open-source моделі, чипи NVIDIA H100 на ринку оренди пережили яскравий момент «V-подібного» розвороту за ціною.

Відомо, що цей чип був представлений Дженсеном Хуангом на **GTC у березні 2022 року, а почав поставлятися пізньої осені того ж року**.

Згідно з оприлюдненим у четвер дослідницьким інститутом напівпровідників SemiAnalysis «Індексом цін контрактів оренди H100 на один рік», **після того як “старий чип” досяг 1,7 долара за годину в жовтні 2025 року, він у березні цього року стрибнув до 2,35 долара за годину за кожну GPU, піднявшись майже на 40%**.


(Джерело: SemiAnalysis)

Цей індекс побудовано на основі даних прямого опитування понад 100 хмарних сервіс-провайдерів, а також покупців і продавців обчислювальних ресурсів; дані збираються раз на місяць.

Останній звіт вказує, що доступна «за потребою» потужність GPU повністю розпродана серед усіх типів GPU — навіть попри недавнє зростання цін ті клієнти, які вже зафіксували потужності в екземплярах за потребою, не бажають вивільняти ці обчислення назад у пул ресурсів. Дослідницька компанія також влучно порівняла це з тим, як у на початку 2026 року шукати потужність GPU — ніби намагатися забронювати квитки на «останній рейс, що ще відлітає»: ціни високі, а доступних ресурсів майже немає.

Дослідники додали: «Клієнти вишукуються, щоб купувати на аукціоні екземпляри Amazon Cloud Services p6-b200 за ціною 14 доларів за годину за кожну GPU. Деякі нові гіганти хмарних сервісів (Neocloud Giants) навіть уже не пропонують продаж окремого вузла; **частина GPU NVIDIA H100 досі продовжують контракти за початковою ціною, зафіксованою під час підписання 2–3 роки тому, а деякі контракти H100 взагалі продовжені аж до 2028 року**».

А що щодо більш просунутих чипів Blackwell із кращою архітектурою? Дослідники зазначили, що через сильний попит на моделі з відкритими вагами та безперервне зростання потреби в інференсі терміни постачання для нового розгортання Blackwell нині подовжилися до 6–7 місяців.

Наприкінці 2025 року ринок певний час очікував, що через прискорення розгортання Blackwell — чипів із сильнішою продуктивністю та нижчою вартістю обчислень — орендні ціни чипів Hopper (H100, H200) можуть суттєво знизитися. Але останні події якраз протилежні: зараз попит на H100 не лише залишається стійким, а в багатьох випадках навіть зростає.

SemiAnalysis у звіті зазначає, що **одним із ключових драйверів попиту на обчислювальну потужність на початку цього року є генерація контенту нативними медіа**. Наприклад, Seedance (тобто Dream) від ByteDance та Nano Banana від Google під час того, як користувачі масово генерують і оптимізують відео/зображення, різко підвищують пропускну здатність токенів (token). Ще більш помітне джерело попиту — поява навантажень для багатоагентних систем (multi-agent), що штовхає використання токенів і витрати обчислень до параболічного зростання.

SemiAnalysis зазначає, що лише вони самі «за минулий тиждень спожили десятки мільярдів токенів», а вартість за кожен мільйон токенів становить близько 5 доларів. Однак компанія також висловлює задоволення тим, що віддача від цього — зекономлений час та розширення робочих процесів і можливостей — значно перевищує витрати на обчислювальну потужність.

У звіті також сказано, що **динаміка, за якої пропозиція обчислювальної потужності стискається, а ціни зростають, не узгоджується із широкими ринковими настроями**. Акції CoreWeave, Nebius та інших нових хмарних сервіс-провайдерів перебувають на нижніх рівнях у межах діапазону останніх 6–12 місяців. Аналіз вказує, що зараз ринок все ще «орієнтується» на наратив про те, що з часом станеться надлишок пропозиції та товаризація обчислювальної потужності. Але реальність інша: в умовах агресивного дефіциту пропозиції практично всі типи обчислювальних ресурсів зберігатимуть стабільний високий попит — незалежно від різниці в їх відносній продуктивності.

У майбутньому дослідники називають три ключові моменти спостереження, щоб визначити, чи залишаться орендні ціни на GPU на високому рівні.

По-перше, у міру того як кластер GB300 поступово нарощуватиме обсяги протягом усього 2026 року, ринок буде стежити, чи зможе нова пропозиція реально послабити нинішню напругу дефіциту обчислювальної потужності. По-друге, потрібно стежити, чи буде погіршуватися безперервний дефіцит чипів. По-третє, слід спостерігати за розширенням річного регулярного доходу (ARR) великих AI-гігантів, а також за темпами поширення AI-застосунків і сталим зростанням масштабів споживання токенів.

(Джерело: Caixin Finance)
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити