AI обчислювальні витрати постійно зростають, ціни на GPU "як нафта" коливаються в залежності від попиту та пропозиції.

robot
Генерація анотацій у процесі

Вартість AI-інфраструктури зазнає різких коливань, а непередбачуваність цін на сервери GPU стала головним викликом для хмарних провайдерів і розробників AI.

За даними The Information, через дефіцит пам’яті та інших ключових компонентів ціни на сервери AI від NVIDIA постійно зростали останніми місяцями, а вартість деяких компонентів коливалася до 40% на тиждень. Це змусило кількох хмарних провайдерів підвищити орендні ціни для розробників AI — хмарний провайдер GPU Nebius із 1 червня підвищив ціну на оренду обчислювальних потужностей за запитом приблизно на 30%, а Amazon AWS оголосив про підвищення цін на блоки ємності EC2 приблизно на 20% з 1 липня.

Різкі коливання цін змінюють структуру витрат на ринку обчислювальних потужностей AI. Генеральний директор постачальника даних про ціни Silicon Data Кармен Лі заявила, що ціни на оренду GPU, які хмарні провайдери стягують з клієнтів, вже демонструють характеристики, подібні до ринків сировинних товарів, таких як нафта, що зумовлені попитом і пропозицією. Найбільше страждають малі та середні клієнти, які орендують обчислювальні потужності за запитом, а непрозорість механізму ціноутворення ще більше посилює інформаційну невигідність покупців.

Різкі коливання вартості компонентів, вікно ціноутворення серверів надзвичайно звужується

Нестабільність цін на сервери GPU зумовлена високою напруженістю в ланцюгах постачання компонентів вищої ланки.

За словами людини, яка продає сервери NVIDIA хмарним провайдерам, вартість компонентів, необхідних для стійок серверів, може коливатися до 40% за тиждень, включаючи вхідні пластини, вироблені TSMC, спільне пакування, мережеве обладнання, охолодження та, найбільш помітні, компоненти пам’яті. Ця особа прямо заявила, що ціни на стійки серверів GPU «дуже сильно коливаються», «все може повністю змінитися за два-три тижні, неможливо передбачити тенденцію цін, і можна лише зафіксувати ціну у дуже короткому вікні», що не дозволяє планувати витрати на довший період.

Один топ-менеджер хмарного провайдера GPU повідомив, що придбані ним серверні стійки останнім часом дорожчають приблизно на 2–3% щотижня. Інший топ-менеджер конкуруючої компанії зазначив, що накопичувачі NVMe в стійках NVIDIA Grace Blackwell 300 є основним джерелом коливань цін, і кілька місяців тому вони коливалися «дуже різко», зараз вартість стійки на 10–15% вища за «базову ціну», яку він вважав нормальною. Тенденція подорожчання стійок GB300, здається, стабілізується, щомісячне зростання становить близько 1%.

Вплив коливань цін різко посилюється через величезні абсолютні суми. Одна стійка, заповнена системами на чипах Grace Blackwell 300, коштує 70 000 доларів за одну систему, загальна вартість 72 стійок у повній комплектації становить близько 5 мільйонів доларів, а деякі клієнти закуповують тисячі таких стійок одночасно. За словами одного топ-менеджера клієнта, який купує стійки Vera Rubin, очікувана ціна такої стійки становить близько 7 мільйонів доларів.

Цінова влада послідовно передається по ланцюгу постачання, NVIDIA та виробники пам’яті утримують домінування

За цим подорожчанням стоїть висока концентрація цінової влади в усіх ланках ланцюга постачання.

Згаданий продавець серверів заявив, що NVIDIA «може вимагати практично будь-яку ціну». Представник NVIDIA відповів, що ціна залежить від вартості компонентів стійки сервера, і компанія співпрацює з постачальниками серверів для встановлення цін, причому ціни можуть відрізнятися між різними постачальниками. Дані показують, що за останні кілька років рентабельність NVIDIA зросла на 15–20 відсоткових пунктів, що підтверджує її сильну ринкову цінову силу.

Водночас виробники мікросхем пам’яті, такі як Micron, чинять подібний ціновий тиск на NVIDIA та інших клієнтів, спричиняючи зростання цін на продукти від Mac від Apple до графічних процесорів NVIDIA.

Кармен Лі зазначила, що як тільки чіпи залишають NVIDIA, ціни, які хмарні провайдери встановлюють на оренду, починають слідувати логіці попиту та пропозиції на ринку сировини. Її дані показують, що орендна ціна чипів Blackwell 200 зросла приблизно на 20% з початку року; після того, як орендні ціни на старіші чіпи NVIDIA зросли більш ніж на 20% за останній рік, вони в основному стабілізувалися за останні 30 днів.

Малі та середні клієнти несуть найбільший тягар, структурна відсутність прозорості ціноутворення на ринку

У цьому раунді підвищення цін клієнти, які орендують обчислювальні потужності за запитом, перебувають у найбільш вразливому становищі.

Хмарні провайдери досліджують верхню межу цін в умовах дефіциту GPU, або переорієнтують ресурси серверів на великих клієнтів, що зменшує доступні обчислювальні потужності для малих і середніх клієнтів. Однак тенденція цін не є односторонньою. Один топ-менеджер компанії-розробника моделей AI заявив, що після подвоєння цін один-два місяці тому, за останні два тижні ціни фактично знизилися. Ця розбіжність відображає те, що ринок хмарних послуг GPU все ще перебуває на відносно ранній стадії, а кількість хмарних провайдерів GPU різко зросла, тому структура ринку ще не сформувалася остаточно.

Відсутність прозорості цін ще більше посилює невизначеність покупців. Хмарні провайдери GPU зазвичай не розкривають фактичні ціни, що дозволяє їм фактично тримати контроль над ціноутворенням, а не клієнтам.

Інвестор одного з хмарних провайдерів GPU висловив занепокоєння: «Для наших ключових клієнтів існує критична точка — щойно економіка перестає збігатися, їхній бізнес стає нежиттєздатним, і ми категорично не хочемо перетинати цю червону лінію». Ця заява показує, що постійне зростання вартості обчислювальних потужностей зрештою створить суттєві обмеження для комерційної життєздатності прикладного рівня AI.

Попередження про ризики та застереження

        Ринок має ризики, інвестування потребує обережності. Ця стаття не є індивідуальною інвестиційною рекомендацією і не враховує особливі інвестиційні цілі, фінансовий стан або потреби окремих користувачів. Користувачі повинні враховувати, чи відповідають будь-які думки, погляди або висновки в цій статті їхній конкретній ситуації. Інвестування на основі цієї інформації здійснюється на власний ризик.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено