Ф'ючерси
Сотні безстрокових контрактів
CFD
Золото
Одна платформа для світових активів
Опціони
Hot
Торгівля ванільними опціонами європейського зразка
Єдиний рахунок
Максимізуйте ефективність вашого капіталу
Демо торгівля
Вступ до ф'ючерсної торгівлі
Підготуйтеся до ф’ючерсної торгівлі
Ф'ючерсні події
Заробляйте, беручи участь в подіях
Демо торгівля
Використовуйте віртуальні кошти для безризикової торгівлі
CFD
CFD-деривативи на акції США
Акції США
Отримайте доступ до реальних акцій США та ETF
Акції Гонконгу
Торгуйте якісними акціями з лістингом у Гонконгу
Корейські акції
Торгуйте реальними корейськими акціями та інвестуйте в популярні активи
Ф'ючерси на акції
Високе кредитне плече, торгівля 24/7
Токенізовані акції
Забезпечено реальними фондовими активами
IPO Access
Отримайте повний доступ до глобальних IPO акцій
GUSD
Мінтіть GUSD для отримання дохідності від казначейських RWA
Активності з акціями
Торгуйте популярними акціями та відкривайте щедрі аірдропи
Запуск
CandyDrop
Збирайте цукерки, щоб заробити аірдропи
Launchpool
Швидкий стейкінг, заробляйте нові токени
HODLer Airdrop
Утримуйте GT і отримуйте масові аірдропи безкоштовно
IPO Access
Отримайте повний доступ до глобальних IPO акцій.
Alpha Поінти
Ончейн-торгівля та аірдропи
Ф'ючерсні бали
Заробляйте фʼючерсні бали та отримуйте аірдроп-винагороди
Інвестиції
Simple Earn
Заробляйте відсотки за допомогою неактивних токенів
Автоінвестування
Автоматичне інвестування на регулярній основі
Подвійні інвестиції
Прибуток від волатильності ринку
Soft Staking
Earn rewards with flexible staking
Криптопозика
0 Fees
Заставте одну криптовалюту, щоб позичити іншу
Центр кредитування
Єдиний центр кредитування
Центр багатства VIP
Преміальні плани зростання капіталу
Управління приватним капіталом
Розподіл преміальних активів
Квантовий фонд
Квантові стратегії найвищого рівня
Стейкінг
Стейкайте криптовалюту, щоб заробляти на продуктах PoS
Розумне кредитне плече
Кредитне плече без ліквідації
USD1 8% річних
Без блоку, вивід у будь-який час
Акції
Центр діяльності
Беріть учать та отримуйте винагороди
Реферал
20 USDT
Запрошуйте друзів та отримуйте бонуси
Партнерська програма
Ексклюзивні комісійні винагороди
Gate Booster
Зростайте та отримуйте аірдропи
Оголошення
Оновлення платформи в реальному часі
Блог Gate
Статті про криптоіндустрію
VIP послуги
Величезні знижки на комісії
Управління активами
Універсальне рішення для управління активами
Інституційний
Рішення цифрових активів для бізнесу
Розробники (API)
Підключається до екосистеми додатків Gate
Позабіржовий банківський переказ
Поповнюйте та виводьте фіат
Брокерська програма
Щедрі механізми знижок API
AI
Gate AI
Ваш універсальний AI-помічник для спілкування
Gate AI Bot
Використовуйте Gate AI безпосередньо у своєму соціальному додатку
GateClaw
Gate Блакитний Лобстер — готовий до використання
Gate for AI Agent
AI-інфраструктура, Gate MCP, Skills і CLI
Gate Skills Hub
Понад 10 000 навичок
Від офісу до трейдингу: універсальна база навичок для ефективнішої роботи з AI
Чи справді настав ера штучного інтелекту? Триєдина переробка обчислювальної потужності: GPU, CPU та ASIC
2026年6月22日, американський фондовий ринок у секторі мікросхем різко зріс — індекс напівпровідників Філадельфії за один день піднявся на 6,42%, Intel через новини про спільне виробництво чипів з Apple подорожчав більш ніж на 10%, ADR TSMC піднявся на 6,94% і закрився на рівні 462,12 долара, Nvidia піднялася майже на 3%. За цим настроєм ринку стоїть швидко зростаюче галузеве судження: структура попиту на обчислювальні потужності AI вже змістилася з тренувального драйву до драйву для виведення.
За даними галузевих аналітиків, частка запитів на виведення у загальному попиті на обчислювальні ресурси AI зросла з приблизно третини у 2023 році до двох третин у 2026 році, і очікується, що до 2028-2030 років вона досягне 70% — 85%. Ця структурна зміна знову визначає головний бойовий полігон конкуренції у сфері чипів — від “хто швидше тренує GPU” до “хто має найнижчі загальні витрати на виведення та найвищу пропускну здатність”.
Глобальний ринок AI-чипів для виведення у 2024 році оцінюється у 85,4 мільярда доларів, і прогнозується зростання до 570,77 мільярда доларів у 2033 році з середньорічним темпом зростання 23,5% у періоді. Зокрема, ринок хмарних AI-чипів для виведення у 2025 році оцінюється у 102,19 мільярда доларів, а у 2026 році прогнозується зростання до 118,9 мільярда доларів, з потенціалом досягти 320,98 мільярда доларів до 2032 року. У той час глобальний ринок edge AI-чипів (для виведення та тренування разом) очікується зростання з 34,4 мільярда доларів у 2026 році до 96 мільярдів доларів у 2031 році.
У цьому циклі розширення баланс сил між типами чипів стає тонким і глибоким. GPU залишається найбільшим гравцем на ринку, підкріплений двома потребами — тренування та виведення — і, за прогнозами, до 2031 року збережеться з середньорічним зростанням 20%. Але AI ASIC вважається кількома інституціями найдинамічнішою підгалуззю з швидким зростанням. Аналізатор JPMorgan оцінює, що ринок цифрових AI ASIC до 2026 року досягне приблизно 60-70 мільярдів доларів і збережеться з CAGR понад 40-50% у найближчі роки.
Ще більш цікаво — повернення CPU. Останні три роки CPU довго залишалися на периферії AI-оповіді, але вибуховий попит на виведення змінює цю ситуацію.
Чому CPU повертається на сцену
AI для виведення і тренування суттєво різняться за логікою обчислень. Тренування — це масштабний паралельний процес матричних обчислень — десятки трильйонів плаваючих точок одночасно на тисячах GPU-ядер. Це саме сфера GPU. Але виведення, особливо агентного AI (Agentic AI), включає оркестрування задач, виклики інструментів, багатоступеневу логіку та послідовні рішення. Це не чисте паралельне обчислення, а багато залежить від складної логіки та послідовної обробки, якою краще володіє CPU.
Дослідження Georgia Tech і Intel показує, що у сценаріях Agentic AI від 50% до 90% затримки виникає через CPU, а не через обчислювальні чипи — оскільки великі моделі викликають плагіни, шукають у мережі, обробляють багатоступеневу логіку, і все це керується CPU. Сам Nvidia у березні 2026 року визнав цю реальність: її топ-менеджер Dion Harris відкрито заявив, що “CPU стає вузьким місцем у AI-робочих потоках” — це з компанії, яка вірить, що “GPU — єдиний потрібний чип для AI”.
Зміни у співвідношенні конфігурацій ще яскравіше демонструють цю тенденцію. У фазі тренування AI співвідношення CPU до GPU зазвичай становить 1:8, де GPU виконує більшу частину обчислень. Але у період виведення, згідно з даними TrendForce, це співвідношення швидко наближається до 1:1 або 1:2. Генеральний директор Intel Чень Ліву у Q1 2026 року також зазначив, що тренувальні навантаження зазвичай вимагають 7-8 GPU на один CPU, тоді як для виведення вже достатньо 3-4 GPU на один CPU, і у майбутньому це співвідношення може ще більше вирівнятися до 1:1.
За оцінками CEO Nvidia, Джена Хуанг, для кожного GW дата-центру потрібно приблизно 300 тисяч Rubin GPU, а з урахуванням 136 ядер ARM CPU на кожен — близько 221 тисячі CPU на GW, тобто нове співвідношення CPU до GPU — приблизно 1:1,4. Це значно вище, ніж у часи домінування GPU.
Захисна стіна GPU і виклики для сценаріїв виведення
Хоча CPU повертається, GPU залишається незамінним у фазі виведення AI — головним чином через пропускну здатність пам’яті та паралельну пропускну здатність.
У процесі виведення LLM кожен токен потребує читання сотень мільйонів — сотень мільярдів параметрів, що є типовим пам’ятіємким навантаженням. CPU-варіант залежить від системної DDR-пам’яті, з пропускною здатністю 50-100 ГБ/с; тоді як GPU використовує GDDR6X або HBM, з пропускною здатністю понад 800 ГБ/с, а високопродуктивні GPU з HBM2e — до 1,5 ТБ/с, у 20 разів більше. У тесті Llama 3.1 8B для виведення CPU-варіант видає лише 819 токенів за секунду, тоді як 8 GPU у кластері — 46 841 токен за секунду. При зростанні кількості запитів продуктивність CPU падає до 257 токенів/с, тоді як GPU — майже без деградації.
Що стосується щільності обчислень, GPU з тисячами CUDA-ядер підтримує низько-precision формати FP4/FP8, досягаючи сотень TFLOPS, тоді як CPU у FP32 — лише 1-10 TFLOPS.
Ці дані підтверджують, що у сценаріях високої пропускної здатності та високої паралельності — наприклад, у хмарних сервісах для масштабних користувачів — GPU залишається найкращим рішенням. Nvidia досі домінує у цій сфері: за даними SemiAnalysis, у Q1 2026 року Nvidia має 92% ринку тренувальних чипів і 78% — для виведення. IDC оцінює, що Nvidia контролює близько 81% ринку AI-чипів. Ринок AI-ускорювачів у 2025 році оцінюється у близько 160 мільярдів доларів, а у 2026 — понад 200 мільярдів, з часткою в 66% для виведення.
Однак частка GPU у сценаріях виведення стикається з багатьма викликами — поверненням CPU, конкуренцією ASIC і реаліями структури витрат.
Відповідь виробників CPU у сценаріях виведення
Переоцінка ролі CPU у виведенні вже перетворилася у конкретний ринковий тренд.
Ринок процесорів для дата-центрів швидко зростає під впливом зростаючого попиту на генеративний AI, і, за прогнозами, з 2025 року до 2031 року він зросте з 215 мільярдів до 656 мільярдів доларів. Guohai Securities зазначає, що у надмасштабних дата-центрах вже починається “цикл оновлення”, і у 2026 році поставки серверних CPU зростуть на 25%.
AMD отримує значну вигоду від цієї тенденції. Попит на AI-сервери підштовхнув продажі CPU EPYC, і п’яте покоління Turin вже займає значну частку ринку серверних CPU, і до 2026 року цей сегмент зросте щонайменше на 50%. Аналізатор Bernstein прогнозує, що продажі флагманських процесорів AMD EPYC у 2026 році зростуть на 30%. На ринку серверних CPU станом на початок 2026 року Intel має близько 60% частки, AMD — 24%, Nvidia — 6%. AMD також конкурує у сфері AI за допомогою прискорювачів Instinct, що дає їй унікальну позицію у двобої з Nvidia у сценаріях виведення.
Intel також активно коригує свою стратегію. У червні 2026 року на Computex новий CEO Intel Чень Ліву оголосив про повернення CPU у центр уваги за допомогою процесу 18A і архітектури з роз’єднаним масштабуванням: у сценаріях виведення CPU знову стає головним, і інфраструктура AI переходить від “купівлі всього пакету” до “збірки Lego”. Вбудована технологія розширення матриць (AMX) у процесорах Xeon дозволяє прискорювати виведення великих мовних моделей без додаткових GPU або інших AI-ускорювачів.
Найбільш символічною зміною є те, що сама Nvidia, яка визначила еру AI через GPU, у 2026 році почала випускати лінійки CPU Grace і Vera, причому Vera орієнтована саме на сценарії виведення та агентного AI. Nvidia прогнозує у 2026 році дохід від CPU у 20 мільярдів доларів. У 2026 році Nvidia і Arm також випустили окремі CPU, що ознаменувало офіційний вихід гіганта GPU у сегмент CPU.
ASIC і спеціалізовані чипи: новий тренд
Поза двобоєм GPU і CPU, ASIC (спеціалізовані інтегральні схеми) стає найшвидше зростаючим сегментом у сфері виведення.
TD Cowen прогнозує, що частка комерційних прискорювачів зменшиться з 91% у 2025 році до 75% у 2030-му, тоді як замовні ASIC зростуть з 9% до 25%. Випуск ASIC-серверів у 2026 році зросте на 44,6%, тоді як GPU — лише на 16,1%, що у 3 рази менше.
Великі хмарні провайдери прискорюють розробку власних ASIC для виведення. Google TPU, AWS Inferentia, Meta MTIA і Groq LPU (Language Processing Unit) — всі створюються для оптимізації сценаріїв виведення. Broadcom у другому кварталі 2026 року отримала 10,8 мільярда доларів доходу від AI, що на 143% більше, ніж у попередньому році, і прогнозує у 2026 році досягти 56 мільярдів доларів, з часткою у 60% на ринку замовних AI-чипів.
Ця тенденція означає, що ринок виведення рухається від “загальних GPU” до “GPU + CPU + ASIC”. GPU відповідає за високопродуктивне тренування і масштабне виведення, CPU — за оркестрування задач і системне управління, ASIC — за енергоефективність у специфічних сценаріях виведення.
Структура витрат і переформатування економіки виведення
Вибір чипів для виведення зводиться до ключового питання: вартість на мільйон токенів.
У тренуванні пріоритет — точність моделі і час тренування, витрати високі, і це допустимо. Але у виведенні — це безперервна, високочастотна виробнича діяльність — кожен API-запит, кожен користувач — це безпосередні витрати. Тому конкуренція у виведенні зосереджена на “ефективності на одиницю витрат”.
GPU дорожчі у закупівлі. Наприклад, AMD MI300X коштує близько 10-15 тисяч доларів, тоді як Nvidia H100 — 25-40 тисяч доларів. Але вартість одиниці обчислювальної потужності у GPU нижча — наприклад, для хмарного сервісу, де один GPU-інстанс генерує токени дешевше на 40-60% ніж CPU-інстанс. Вартість CPU у масштабі зростає швидше, оскільки при зростанні кількості запитів потрібно більше часу на перемикання задач і контекстуальні переключення, що зменшує ефективність.
У масштабних сценаріях, де потрібна висока пропускна здатність і паралельність, — наприклад, у хмарних сервісах — переваги GPU або ASIC очевидні. Вартість довгострокової окупності (ROI) тут вище через вищу пропускну здатність і нижчі витрати на одиницю продуктивності.
Висновки
Зростання частки виведення з третини до двох третин відображає глибоку зміну у логіці конкуренції за чипи.
Для Nvidia, її домінування у тренувальному сегменті (близько 90%) у короткостроковій перспективі залишиться, але конкуренція у сегменті виведення стане більш жорсткою. За найсміливішими прогнозами, New Street Research передбачає, що частка Nvidia у виведенні до 2028 року може знизитися до 20-30%. Навіть за більш консервативними оцінками Bloomberg Intelligence, Nvidia збережеться з часткою 70-75% до 2030 року, але зростання поставок ASIC значно випереджає GPU.
Для AMD і Intel повернення попиту на CPU у сценаріях виведення — це структурна можливість. AMD із двоголовою стратегією EPYC CPU і Instinct GPU, Intel із процесами 18A і постійною ітерацією Xeon — намагаються скористатися цим моментом.
Для хмарних провайдерів і розробників AI-застосунків збільшення кількості варіантів чипів означає можливість більш тонкої оптимізації витрат. Від універсальних GPU до замовних ASIC, від CPU до GPU-ускорювачів — вибір все більше залежить від конкретних сценаріїв — розмір моделі, затримки, паралельність, бюджет.
Попит на обчислювальні ресурси для виведення зростає швидше, ніж для тренування. Цей перехід від тренувального до виведення — змінює всю ланцюг виробництва від дизайну чипів до архітектури дата-центрів. GPU не зникне, але вже не є єдиним рішенням.