Чи справді настав ера штучного інтелекту? Триєдина переробка обчислювальної потужності: GPU, CPU та ASIC

2026年6月22日, американський фондовий ринок у секторі мікросхем різко зріс — індекс напівпровідників Філадельфії за один день піднявся на 6,42%, Intel через новини про спільне виробництво чипів з Apple подорожчав більш ніж на 10%, ADR TSMC піднявся на 6,94% і закрився на рівні 462,12 долара, Nvidia піднялася майже на 3%. За цим настроєм ринку стоїть швидко зростаюче галузеве судження: структура попиту на обчислювальні потужності AI вже змістилася з тренувального драйву до драйву для виведення.

За даними галузевих аналітиків, частка запитів на виведення у загальному попиті на обчислювальні ресурси AI зросла з приблизно третини у 2023 році до двох третин у 2026 році, і очікується, що до 2028-2030 років вона досягне 70% — 85%. Ця структурна зміна знову визначає головний бойовий полігон конкуренції у сфері чипів — від “хто швидше тренує GPU” до “хто має найнижчі загальні витрати на виведення та найвищу пропускну здатність”.

Глобальний ринок AI-чипів для виведення у 2024 році оцінюється у 85,4 мільярда доларів, і прогнозується зростання до 570,77 мільярда доларів у 2033 році з середньорічним темпом зростання 23,5% у періоді. Зокрема, ринок хмарних AI-чипів для виведення у 2025 році оцінюється у 102,19 мільярда доларів, а у 2026 році прогнозується зростання до 118,9 мільярда доларів, з потенціалом досягти 320,98 мільярда доларів до 2032 року. У той час глобальний ринок edge AI-чипів (для виведення та тренування разом) очікується зростання з 34,4 мільярда доларів у 2026 році до 96 мільярдів доларів у 2031 році.

У цьому циклі розширення баланс сил між типами чипів стає тонким і глибоким. GPU залишається найбільшим гравцем на ринку, підкріплений двома потребами — тренування та виведення — і, за прогнозами, до 2031 року збережеться з середньорічним зростанням 20%. Але AI ASIC вважається кількома інституціями найдинамічнішою підгалуззю з швидким зростанням. Аналізатор JPMorgan оцінює, що ринок цифрових AI ASIC до 2026 року досягне приблизно 60-70 мільярдів доларів і збережеться з CAGR понад 40-50% у найближчі роки.

Ще більш цікаво — повернення CPU. Останні три роки CPU довго залишалися на периферії AI-оповіді, але вибуховий попит на виведення змінює цю ситуацію.

Чому CPU повертається на сцену

AI для виведення і тренування суттєво різняться за логікою обчислень. Тренування — це масштабний паралельний процес матричних обчислень — десятки трильйонів плаваючих точок одночасно на тисячах GPU-ядер. Це саме сфера GPU. Але виведення, особливо агентного AI (Agentic AI), включає оркестрування задач, виклики інструментів, багатоступеневу логіку та послідовні рішення. Це не чисте паралельне обчислення, а багато залежить від складної логіки та послідовної обробки, якою краще володіє CPU.

Дослідження Georgia Tech і Intel показує, що у сценаріях Agentic AI від 50% до 90% затримки виникає через CPU, а не через обчислювальні чипи — оскільки великі моделі викликають плагіни, шукають у мережі, обробляють багатоступеневу логіку, і все це керується CPU. Сам Nvidia у березні 2026 року визнав цю реальність: її топ-менеджер Dion Harris відкрито заявив, що “CPU стає вузьким місцем у AI-робочих потоках” — це з компанії, яка вірить, що “GPU — єдиний потрібний чип для AI”.

Зміни у співвідношенні конфігурацій ще яскравіше демонструють цю тенденцію. У фазі тренування AI співвідношення CPU до GPU зазвичай становить 1:8, де GPU виконує більшу частину обчислень. Але у період виведення, згідно з даними TrendForce, це співвідношення швидко наближається до 1:1 або 1:2. Генеральний директор Intel Чень Ліву у Q1 2026 року також зазначив, що тренувальні навантаження зазвичай вимагають 7-8 GPU на один CPU, тоді як для виведення вже достатньо 3-4 GPU на один CPU, і у майбутньому це співвідношення може ще більше вирівнятися до 1:1.

За оцінками CEO Nvidia, Джена Хуанг, для кожного GW дата-центру потрібно приблизно 300 тисяч Rubin GPU, а з урахуванням 136 ядер ARM CPU на кожен — близько 221 тисячі CPU на GW, тобто нове співвідношення CPU до GPU — приблизно 1:1,4. Це значно вище, ніж у часи домінування GPU.

Захисна стіна GPU і виклики для сценаріїв виведення

Хоча CPU повертається, GPU залишається незамінним у фазі виведення AI — головним чином через пропускну здатність пам’яті та паралельну пропускну здатність.

У процесі виведення LLM кожен токен потребує читання сотень мільйонів — сотень мільярдів параметрів, що є типовим пам’ятіємким навантаженням. CPU-варіант залежить від системної DDR-пам’яті, з пропускною здатністю 50-100 ГБ/с; тоді як GPU використовує GDDR6X або HBM, з пропускною здатністю понад 800 ГБ/с, а високопродуктивні GPU з HBM2e — до 1,5 ТБ/с, у 20 разів більше. У тесті Llama 3.1 8B для виведення CPU-варіант видає лише 819 токенів за секунду, тоді як 8 GPU у кластері — 46 841 токен за секунду. При зростанні кількості запитів продуктивність CPU падає до 257 токенів/с, тоді як GPU — майже без деградації.

Що стосується щільності обчислень, GPU з тисячами CUDA-ядер підтримує низько-precision формати FP4/FP8, досягаючи сотень TFLOPS, тоді як CPU у FP32 — лише 1-10 TFLOPS.

Ці дані підтверджують, що у сценаріях високої пропускної здатності та високої паралельності — наприклад, у хмарних сервісах для масштабних користувачів — GPU залишається найкращим рішенням. Nvidia досі домінує у цій сфері: за даними SemiAnalysis, у Q1 2026 року Nvidia має 92% ринку тренувальних чипів і 78% — для виведення. IDC оцінює, що Nvidia контролює близько 81% ринку AI-чипів. Ринок AI-ускорювачів у 2025 році оцінюється у близько 160 мільярдів доларів, а у 2026 — понад 200 мільярдів, з часткою в 66% для виведення.

Однак частка GPU у сценаріях виведення стикається з багатьма викликами — поверненням CPU, конкуренцією ASIC і реаліями структури витрат.

Відповідь виробників CPU у сценаріях виведення

Переоцінка ролі CPU у виведенні вже перетворилася у конкретний ринковий тренд.

Ринок процесорів для дата-центрів швидко зростає під впливом зростаючого попиту на генеративний AI, і, за прогнозами, з 2025 року до 2031 року він зросте з 215 мільярдів до 656 мільярдів доларів. Guohai Securities зазначає, що у надмасштабних дата-центрах вже починається “цикл оновлення”, і у 2026 році поставки серверних CPU зростуть на 25%.

AMD отримує значну вигоду від цієї тенденції. Попит на AI-сервери підштовхнув продажі CPU EPYC, і п’яте покоління Turin вже займає значну частку ринку серверних CPU, і до 2026 року цей сегмент зросте щонайменше на 50%. Аналізатор Bernstein прогнозує, що продажі флагманських процесорів AMD EPYC у 2026 році зростуть на 30%. На ринку серверних CPU станом на початок 2026 року Intel має близько 60% частки, AMD — 24%, Nvidia — 6%. AMD також конкурує у сфері AI за допомогою прискорювачів Instinct, що дає їй унікальну позицію у двобої з Nvidia у сценаріях виведення.

Intel також активно коригує свою стратегію. У червні 2026 року на Computex новий CEO Intel Чень Ліву оголосив про повернення CPU у центр уваги за допомогою процесу 18A і архітектури з роз’єднаним масштабуванням: у сценаріях виведення CPU знову стає головним, і інфраструктура AI переходить від “купівлі всього пакету” до “збірки Lego”. Вбудована технологія розширення матриць (AMX) у процесорах Xeon дозволяє прискорювати виведення великих мовних моделей без додаткових GPU або інших AI-ускорювачів.

Найбільш символічною зміною є те, що сама Nvidia, яка визначила еру AI через GPU, у 2026 році почала випускати лінійки CPU Grace і Vera, причому Vera орієнтована саме на сценарії виведення та агентного AI. Nvidia прогнозує у 2026 році дохід від CPU у 20 мільярдів доларів. У 2026 році Nvidia і Arm також випустили окремі CPU, що ознаменувало офіційний вихід гіганта GPU у сегмент CPU.

ASIC і спеціалізовані чипи: новий тренд

Поза двобоєм GPU і CPU, ASIC (спеціалізовані інтегральні схеми) стає найшвидше зростаючим сегментом у сфері виведення.

TD Cowen прогнозує, що частка комерційних прискорювачів зменшиться з 91% у 2025 році до 75% у 2030-му, тоді як замовні ASIC зростуть з 9% до 25%. Випуск ASIC-серверів у 2026 році зросте на 44,6%, тоді як GPU — лише на 16,1%, що у 3 рази менше.

Великі хмарні провайдери прискорюють розробку власних ASIC для виведення. Google TPU, AWS Inferentia, Meta MTIA і Groq LPU (Language Processing Unit) — всі створюються для оптимізації сценаріїв виведення. Broadcom у другому кварталі 2026 року отримала 10,8 мільярда доларів доходу від AI, що на 143% більше, ніж у попередньому році, і прогнозує у 2026 році досягти 56 мільярдів доларів, з часткою у 60% на ринку замовних AI-чипів.

Ця тенденція означає, що ринок виведення рухається від “загальних GPU” до “GPU + CPU + ASIC”. GPU відповідає за високопродуктивне тренування і масштабне виведення, CPU — за оркестрування задач і системне управління, ASIC — за енергоефективність у специфічних сценаріях виведення.

Структура витрат і переформатування економіки виведення

Вибір чипів для виведення зводиться до ключового питання: вартість на мільйон токенів.

У тренуванні пріоритет — точність моделі і час тренування, витрати високі, і це допустимо. Але у виведенні — це безперервна, високочастотна виробнича діяльність — кожен API-запит, кожен користувач — це безпосередні витрати. Тому конкуренція у виведенні зосереджена на “ефективності на одиницю витрат”.

GPU дорожчі у закупівлі. Наприклад, AMD MI300X коштує близько 10-15 тисяч доларів, тоді як Nvidia H100 — 25-40 тисяч доларів. Але вартість одиниці обчислювальної потужності у GPU нижча — наприклад, для хмарного сервісу, де один GPU-інстанс генерує токени дешевше на 40-60% ніж CPU-інстанс. Вартість CPU у масштабі зростає швидше, оскільки при зростанні кількості запитів потрібно більше часу на перемикання задач і контекстуальні переключення, що зменшує ефективність.

У масштабних сценаріях, де потрібна висока пропускна здатність і паралельність, — наприклад, у хмарних сервісах — переваги GPU або ASIC очевидні. Вартість довгострокової окупності (ROI) тут вище через вищу пропускну здатність і нижчі витрати на одиницю продуктивності.

Висновки

Зростання частки виведення з третини до двох третин відображає глибоку зміну у логіці конкуренції за чипи.

Для Nvidia, її домінування у тренувальному сегменті (близько 90%) у короткостроковій перспективі залишиться, але конкуренція у сегменті виведення стане більш жорсткою. За найсміливішими прогнозами, New Street Research передбачає, що частка Nvidia у виведенні до 2028 року може знизитися до 20-30%. Навіть за більш консервативними оцінками Bloomberg Intelligence, Nvidia збережеться з часткою 70-75% до 2030 року, але зростання поставок ASIC значно випереджає GPU.

Для AMD і Intel повернення попиту на CPU у сценаріях виведення — це структурна можливість. AMD із двоголовою стратегією EPYC CPU і Instinct GPU, Intel із процесами 18A і постійною ітерацією Xeon — намагаються скористатися цим моментом.

Для хмарних провайдерів і розробників AI-застосунків збільшення кількості варіантів чипів означає можливість більш тонкої оптимізації витрат. Від універсальних GPU до замовних ASIC, від CPU до GPU-ускорювачів — вибір все більше залежить від конкретних сценаріїв — розмір моделі, затримки, паралельність, бюджет.

Попит на обчислювальні ресурси для виведення зростає швидше, ніж для тренування. Цей перехід від тренувального до виведення — змінює всю ланцюг виробництва від дизайну чипів до архітектури дата-центрів. GPU не зникне, але вже не є єдиним рішенням.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено