Возникновение дефицита GPU: облачные провайдеры ужесточают поставки, стартапы в области ИИ сталкиваются с ростом цен на аренду чипов на 32% и долгими ожиданиями до конца года

Согласно мониторингу компании Beating, несколько стартапов в области искусственного интеллекта сообщили, что облачные провайдеры, такие как Microsoft и Amazon, сосредоточили вычислительную мощность GPU на внутренних командах и крупных клиентах (таких как OpenAI и Anthropic), оставляя малым и средним клиентам сталкиваться с ростом цен, долгими очередями и более строгими условиями контрактов. Недавно менеджеры по продажам Azure сообщили сотрудникам, что ожидание GPU для облачных клиентов продлится до конца 2026 года. Один из конкретных случаев касается стартапа по генерации изображений Krea (который привлек $83 миллионов долларов, с инвесторами, включая Andreessen и Bain Capital Ventures), который арендовал сотни чипов Blackwell за $2,80 за карту в час шесть месяцев назад по шестимесячному контракту. Когда пришло время продлевать, несколько облачных провайдеров не отвечали на звонки, и окончательная сделка была заключена по цене $3,70/час, что на 32% больше, с продлением контракта до одного года. Генеральный директор Виктор Перес заявил, что некоторые провайдеры вообще не отвечали, а другие вели переговоры только по трёхлетним контрактам. Генеральный директор Lightning AI, поставщика GPU-облачных услуг, Фалкон, сообщил, что у компании в сети 40 000 GPU, но общий спрос примерно от 40 клиентов в очереди достигает 400 000 GPU, а цены на аренду выросли более чем на 25% за шесть месяцев. Microsoft внедряет многоуровневое управление доступом к GPU: примерно 1 000 крупнейших клиентов (Tier 1) получают приоритет; меньшие клиенты, желающие арендовать чипы Blackwell, должны взять минимум 1 000 единиц на срок не менее одного года, при этом контракты начинаются с десятков миллионов долларов. Клиенты по модели pay-as-you-go могут потерять доступ, если их GPU простаивают несколько часов. Стартапы, участвующие в бесплатной программе ‘Microsoft for Startups’, также были проинформированы, что недостаточное использование приведет к отзыву доступа к GPU. Хемант Танея, партнер компании General Catalyst, опросил портфельные компании о проблемах с вычислительной мощностью, и фирма планирует создать совместный пул вычислений или коллективные переговоры для инвестированных компаний. Некоторые стартапы начинают рассматривать возможность покупки GPU напрямую: AI-стартап Collide в нефтяной промышленности планирует потратить около $500 000 на прямую покупку GPU NVIDIA и аренду дата-центров для самостоятельной работы, чтобы избежать очередей и неопределенностей.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить