Зі всеохоплюючим впровадженням ШІ, конкуренція між компаніями переходить від простої гонитви за апаратною потужністю до створення масштабованих, економічних систем для виведення висновків. Red Hat та Intel повністю підтримують відкритий вихідний код vLLM у середовищі процесорів Xeon, сприяючи гібридному розгортанню CPU-GPU, а також дозволяючи CPU виконувати роль проксі-ШІ для виведення висновків і використовувати GPU лише за потреби, зменшуючи вартість за кожен токен і підвищуючи управління та операційну ефективність. Майбутній успіх ШІ залежить від співвідношення витрат і вигод, відкритого програмного забезпечення та оптимізованих комбінацій апаратного забезпечення.

TechubNews

2026-05-13 16:10:08

Генерація анотацій у процесі

Зі зростанням впровадження штучного інтелекту (ШІ) підприємствами, що виходить за межі експериментальної стадії та переходить до повномасштабного розповсюдження, ключові фактори перемоги на ринку також змінюються. Нині основою конкуренції вже не є просто накопичення більших моделей та більшої кількості графічних процесорів (GPU), а здатність краще будувати «масштабовані системи ШІ для роз inference», які стабільно працюють при контролі бюджету.

Red Hat та Intel відповідно до цієї тенденції прискорюють розгортання інфраструктури для ШІ на основі відкритих технологій. Головний інженер з інженерії ШІ в Red Hat Танеем Ібрагім та віце-президент відділу дата-центрів та ШІ в Intel Білл Пірсон на конференції «Red Hat Summit 2026» зазначили, що реальні виклики у масштабному обслуговуванні ШІ-послуг полягають у ефективності витрат та оптимізації комбінації інфраструктури.

Від переваги GPU до паралельної стратегії CPU

На початковій стадії поширення генеративного ШІ, після появи ChatGPT та відкритих моделей з вагами, основною практикою було розгортання великих моделей на великих кластерах GPU. Однак у реальному корпоративному середовищі операційні витрати та контроль стають не менш важливими за продуктивність, і тому питання ефективного масштабування моделей на платформах Red Hat Enterprise Linux (RHEL) та OpenShift стає ключовим.

Ібрагім зазначив, що Red Hat все більше думає про те, як у масштабних середовищах ефективно керувати одним із своїх найбільш важливих відкритих проектів — «vLLM». Він підкреслив, що головним викликом є зниження «вартості за кожен токен», щоб застосовувати ШІ у реальному бізнесі, зберігаючи при цьому можливості управління та масштабування.

Останнім часом пріоритети інфраструктури також змінюються. Пірсон пояснив, що у порівнянні з початковим етапом, орієнтованим на GPU, з поширенням «агентного ШІ» роль центрального процесора (CPU) знову стає важливою. Це означає, що не всі завдання ШІ потребують GPU, і залежно від типу оброблюваних навантажень важливо правильно поєднувати CPU та GPU.

Red Hat та Intel розширюють підтримку vLLM на базі Xeon

З урахуванням цього, обидві компанії інтегрували у версію «Red Hat AI 3.4» повну підтримку vLLM у середовищі Intel Xeon. Головна ідея полягає не у застосуванні «однакових налаштувань для всіх клієнтів», а у проектуванні апаратного та програмного забезпечення відповідно до характеру бізнесу та очікуваних результатів кожної компанії.

Пірсон зазначив, що раніше багато компаній підходили до цього з позиції «маю молоток — все здається цвяхом», орієнтуючись на GPU. Однак він пояснив, що переоцінка ресурсів CPU у дата-центрах, які вже масштабно розгорнуті, та перехід до додавання GPU за потребою дозволяє досягти кращої продуктивності при нижчих витратах.

Особливо, такі завдання, як виклики інструментів та оркестрація даних у агентних ШІ, багато з яких можна обробляти без GPU. Intel вважає, що делегування таких inference-завдань CPU дозволяє GPU зосередитися на більш важких обчисленнях, підвищуючи загальну ефективність системи.

Конкуренція у інфраструктурі ШІ: «Операційна ефективність» стає важливішою за «продуктивність»

Ця дискусія показує, що ринок ШІ вже перейшов від конкуренції за найкращі моделі до змагання за економічність у операційному етапі. Для компаній важливо не лише отримати найвищу продуктивність обладнання, а й максимально ефективно використовувати існуючі ресурси дата-центру, одночасно знижуючи «вартість за токен» та забезпечуючи стабільне обслуговування.

У підсумку, переможець у наступному поколінні ШІ, ймовірно, буде не той, хто має найпотужніше обладнання, а той, хто зможе оптимізувати співвідношення CPU та GPU і використовувати відкриті рішення для максимальної «вартості». Співпраця Red Hat та Intel у цьому контексті вважається кроком у відповідь на цю тенденцію ринку.

TP AI Підказка Цей текст створено на основі мовної моделі TokenPost.ai. Основний зміст може бути неповним або не відповідати фактам.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

Нагородити
подобається
Прокоментувати
Репост
Поділіться

Прокоментувати

Додати коментар

Немає коментарів

Популярні теми
Дізнатися більше
#
GateSquareMayTradingShare
1.52M Популярність
#
AprilCPIComesInHotterAt3.8%
12.61M Популярність
#
IsraelStrikesIranBTCPlunges
46.51K Популярність
#
#DailyPolymarketHotspot
914.6K Популярність
#
WalshConfirmedAsFedChair
1.98M Популярність

Закріпити

карта сайту

Red Hat та Intel розширюють підтримку vLLM на базі Xeon

Популярні теми

GateSquareMayTradingShare

AprilCPIComesInHotterAt3.8%

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

WalshConfirmedAsFedChair

Закріпити