DeepInfra,系列B融资1.07亿美元……AI推理基础设施全球扩张

robot
Генерация тезисов в процессе

Фирма DeepInfra, специализирующаяся на облачных вычислениях для искусственного интеллекта и сосредоточенная на выводе (инференсе), привлекла 107 миллионов долларов во втором раунде финансирования, что позволит расширить глобальную инфраструктуру устройств. В юанях это примерно 1,581 миллиарда 925 миллионов юаней. На этапе перехода генеративного ИИ за пределы экспериментальной стадии к “агентному ИИ” DeepInfra планирует преодолеть ограничения существующих универсальных облачных платформ.

Этот раунд инвестиций возглавили 500 Global и бывший инженер Google Cloud George Harrick. Также участвовали Nvidia, инвестиционный отдел Samsung Electronics Samsung Next, Supermicro, A.Capital Ventures, Crescent Cove, Peliciis, Peak6, Upper90 и другие. Примечательно, что основные инвесторы одновременно обращают внимание на растущий потенциал рынка инфраструктуры для ИИ.

DeepInfra — компания, сосредоточенная на этапе “вывода” в рабочих нагрузках ИИ. Вывод — это стадия, когда обученная модель ИИ обрабатывает запросы пользователей в реальных условиях. Компания считает, что существующие облачные платформы не проектировались с учетом таких требований. Они объясняют, что особенно агентный ИИ требует десятков или сотен вызовов модели для выполнения одной задачи, что может привести к резким задержкам и нестабильным затратам.

Для решения этой проблемы DeepInfra заявляет, что разрабатывает “фабрику токенов”, которая рассматривает вывод как основной процесс, а не как дополнительную услугу. Компания была основана командой инженеров, создавших мессенджер “imo”, который вырос до более чем 200 миллионов пользователей по всему миру. Их стратегия — перенести опыт эксплуатации масштабных распределенных систем на инфраструктуру для ИИ-инференса.

В отличие от существующих операторов, которые используют арендованные неиспользуемые серверы (“Spot”), DeepInfra управляет собственным оборудованием в восьми дата-центрах США. Они описывают, что повышают эффективность, контролируя весь стек — от GPU до API. Компания утверждает, что с помощью распределенной платформы Nvidia “Dynamo” и GPU Blackwell, Vera Rubin, можно добиться до 20-кратной эффективности затрат на вывод.

Особенно DeepInfra считает, что агентный ИИ потребляет значительно больше ресурсов, чем существующие генеративные чат-боты. В настоящее время более 30% всего трафика токенов на их платформе приходится на автономных агентов, что подтверждает данное утверждение. Это свидетельствует о том, что потребность в ИИ-инференсе выходит за рамки простых ответов чат-ботов и быстро переходит к автоматизации бизнес-процессов.

На данный момент платформа DeepInfra поддерживает более 190 открытых моделей ИИ, включая серию Nvidia Nemotron. Также для корпоративных клиентов, обеспокоенных передачей конфиденциальных данных в облако, предлагается политика “нулевого хранения данных”. Это можно интерпретировать как попытку создать дифференцированное преимущество на рынке корпоративных ИИ, учитывающем безопасность, стоимость и скорость.

Соучредитель и генеральный директор Николай Борисов отметил, что с момента основания компании четыре года назад он был уверен, что вывод ИИ станет ядром корпоративных рабочих нагрузок, и сегодня это подтверждается. Он отметил, что открытые модели быстро догоняют закрытые по стоимости и распространяют инновации, а системы на базе агентов создают устойчивый и масштабный спрос. Он подчеркнул, что вывод ИИ уже не является тонким слоем обработки, а станет “узким местом”, определяющим большинство будущих рабочих нагрузок ИИ.

Тони Ванг из 500 Global также отметил, что при росте спроса на ИИ-инференс разработчикам и инженерам нужны более быстрые, гибкие и стабильные инфраструктуры. Он заявил, что команда DeepInfra уже доказала способность строить и управлять глобальными распределенными системами и считает, что инфраструктура для целенаправленного ИИ-инференса станет ключевым элементом следующего этапа развития индустрии ИИ.

Этот раунд финансирования — не просто сбор средств, а свидетельство того, что конкуренция в инфраструктуре ИИ смещается с обучения на вывод. Особенно с учетом распространения агентного ИИ, быстрое и недорогое решение задач ИИ-инференса становится новым фактором успеха на рынке облачных вычислений.

TP AI — примечания. Этот текст подготовлен на базе модели TokenPost.ai и является кратким изложением. Возможны пропуски основных моментов оригинала или несоответствия фактам.

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить