Знову виникає дефіцит GPU: хмарні провайдери обмежують постачання, стартапи в галузі штучного інтелекту стикаються з підвищенням цін на оренду чіпів на 32% та довгими чергами до кінця року

Згідно з моніторингом Beating, кілька стартапів у галузі штучного інтелекту повідомили, що провайдери хмарних послуг, такі як Microsoft та Amazon, концентрують обчислювальну потужність GPU на внутрішні команди та основних клієнтів (таких як OpenAI та Anthropic), залишаючи малим і середнім клієнтам зіткнутися з підвищенням цін, довгими чергами та більш жорсткими умовами контрактів. Нещодавно менеджери з продажу Azure Microsoft повідомили співробітникам, що очікуваний час очікування GPU для хмарних клієнтів триватиме до кінця 2026 року. Один із конкретних випадків стосується стартапу з генерації зображень Krea (який залучив $83 мільйонів доларів, з інвесторами, включаючи Andreessen та Bain Capital Ventures), що орендували сотні чіпів Blackwell за $2,80 за карту за годину шість місяців тому за шести-місячним контрактом. Коли настав час оновлювати контракт, кілька провайдерів хмарних послуг не відповідали на дзвінки, і остаточна угода була укладена за $3,70/годину, що на 32% більше, з продовженням контракту до одного року. Генеральний директор Віктор Перес заявив, що деякі провайдери взагалі не відповідали, тоді як інші вели переговори лише щодо трирічних контрактів. Віктор Фалкон, генеральний директор провайдера GPU-хмарних послуг Lightning AI, повідомив, що у компанії онлайн працює 40 000 GPU, але загальний попит від близько 40 клієнтів у черзі досягає 400 000 GPU, а ціни оренди за останні шість місяців зросли більш ніж на 25%. Microsoft впроваджує багаторівневе управління доступом до GPU: приблизно 1 000 найбільших клієнтів (Tier 1) мають пріоритет; менші клієнти, які бажають орендувати чіпи Blackwell, повинні зобов’язатися щонайменше на 1 000 одиниць на мінімум один рік, з контрактами, що починаються з десятків мільйонів доларів. Клієнти з оплатою за використанням можуть втратити доступ, якщо їхні GPU будуть простоювати кілька годин. Стартапи, що беруть участь у безкоштовній програмі квот «Microsoft для стартапів», також були повідомлені, що недостатнє використання призведе до зняття доступу до GPU. Гемант Танея, партнер у General Catalyst, опитав портфельні компанії щодо вузьких місць у обчислювальній потужності, і компанія планує створити спільний обчислювальний пул або колективні переговори для інвестованих компаній. Деякі стартапи починають розглядати можливість купівлі GPU безпосередньо: AI-стартап Collide у нафтовій галузі планує витратити близько $500 000 на прямий купівлю GPU NVIDIA та орендувати дата-центр для незалежної роботи, щоб уникнути черг і невизначеності.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити