DeepInfra, серія B залучила 107 мільйонів доларів США… Глобальне розширення інфраструктури для AI-розуміння

robot
Генерація анотацій у процесі

Зосереджена на штучному інтелекті для логіки хмарна компанія DeepInfra залучила 107 мільйонів доларів у раунді фінансування Серії B, що сприятиме глобальному розширенню обладнання. За курсом у йєнах це приблизно 158,192,50 мільярдів ієн. На етапі переходу від експериментальної фази генеративного ШІ до “агентного ШІ” DeepInfra планує подолати обмеження існуючих універсальних хмарних платформ.

Цей раунд інвестицій очолили 500 Global і колишній інженер Google Cloud George Harrick. Крім того, у ньому взяли участь NVIDIA, підрозділ інвестицій Samsung Electronics Samsung Next, Supermicro, A.Capital Ventures, Crescent Cove, Peliciis, Peak6, Upper90 та інші. Варто відзначити, що основні інвестори одночасно звернули увагу на зростаючий потенціал ринку інфраструктури для ШІ.

DeepInfra — це компанія, яка зосереджена на етапі “логіки” у роботі ШІ. Логіка — це стадія, коли натренована модель ШІ обробляє запити користувачів у реальному сервісному середовищі. Компанія вважає, що існуючі хмарні платформи не спроектовані з урахуванням таких потреб. Вони пояснюють, що особливо агентний ШІ для виконання однієї задачі вимагає десятків або сотень викликів моделей, що може спричинити різке зростання затримок і вартості.

Щоб вирішити цю проблему, DeepInfra заявляє, що створює “токенну фабрику”, яка розглядає логіку як основний процес, а не додаткову послугу. Компанія заснована командою інженерів, яка створила месенджер “imo”, що розширився до понад 200 мільйонів користувачів по всьому світу. Їхня стратегія — перенести досвід роботи з масштабними розподіленими системами у інфраструктуру логіки ШІ.

На відміну від існуючих операторів, які покладаються на оренду вільних серверів “Spot”, DeepInfra керує власним обладнанням у восьми дата-центрах у США. Вони описують, що підвищують ефективність через контроль усього стеку — від GPU до API. Компанія стверджує, що використання розподіленої платформи для логіки NVIDIA “Dynamo” і GPU Blackwell, Vera Rubin дозволяє досягти до 20-кратної економії у витратах на логіку.

Особливо DeepInfra вважає, що агентний ШІ споживає набагато більше ресурсів, ніж існуючі генеративні чат-боти. На їхній платформі понад 30% усього трафіку токенів вже походить від автономних агентів, що підтверджує цю ідею. Це свідчить про те, що потреби у логіці ШІ виходять за межі простих відповідей чат-ботів і швидко переходять до автоматизації бізнес-процесів.

Зараз платформа DeepInfra підтримує понад 190 відкритих моделей ШІ, включаючи серію NVIDIA Nemotron. Також для компаній, які відчувають навантаження через передачу конфіденційної інформації до зовнішніх хмар, пропонується політика “нульового збереження даних”. Це інтерпретується як стратегія створення конкурентних переваг у ринку корпоративного ШІ, враховуючи безпеку, вартість і швидкість.

Співзасновник і генеральний директор Nikolai Borisov зазначив, що ще чотири роки тому, засновуючи компанію, він вважав, що логіка ШІ стане ядром корпоративних навантажень, і тепер ця ідея стала реальністю. Він аналізує, що відкриті моделі швидко наздоганяють закриті, поширюючись із меншими затратами, а системи на основі агентів створюють стабільний і масштабний попит. Він підкреслює, що логіка ШІ вже не є тонким шаром обробки, а стане “вузьким місцем”, яке визначатиме більшість майбутніх навантажень ШІ.

Тоні Ванг із 500 Global також відзначає, що у зв’язку з зростанням попиту на логіку ШІ розробники та інженери потребують швидкої, гнучкої та стабільної інфраструктури. Він заявляє, що команда DeepInfra вже довела здатність створювати та керувати масштабними розподіленими системами і вважає, що інфраструктура для цілеспрямованої логіки ШІ стане ключовою основою для наступного етапу розвитку індустрії ШІ.

Це фінансування — не просто збір коштів, а демонстрація того, що конкуренція у сфері інфраструктури ШІ зосереджена не лише на тренуванні моделей, а й на логіці. Особливо з урахуванням поширення агентного ШІ, швидка і недорога обробка логіки ШІ стає все більш важливим фактором у ринку хмарних обчислень.

Застереження TP AI: цей текст базується на мовній моделі TokenPost.ai і є коротким викладом. Можливо, він пропускає основний зміст оригіналу або не відповідає фактам.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити