Витрати на ШІ стають розподіленими: відбувається друга реструктуризація технологічної інфраструктури.

2026 рік, глобальні інвестиції в AI-інфраструктуру стоять на ключовому структурному переломі.

Останні три роки основна наратива гонки AI-обчислювальних потужностей була надзвичайно однорідною: гіперскейлери (Hyperscaler) майже без урахування витрат розширювали дата-центри, закуповували GPU, доводячи капітальні витрати до історичних максимумів. У 2026 році сукупні капітальні витрати чотирьох великих хмарних провайдерів — Amazon, Microsoft, Google (Alphabet) і Meta —, за оцінками, сягнуть 725 мільярдів доларів, що на 77% більше порівняно з 410 мільярдами доларів у 2025 році. Якщо включити NVIDIA, Apple, Tesla до Magnificent Seven, ця цифра наближається до 754,2 мільярда доларів. Gartner прогнозує, що загальні світові витрати на AI у 2026 році досягнуть 2,59 трильйона доларів, що на 47% більше, ніж у попередньому році.

Однак сам масштаб перестає бути єдиним фокусом уваги. Відбувається глибша зміна: AI-капітальні витрати переходять від високої концентрації до розподілення. DIGITIMES визначило ключове технологічне слово 2026 року як "розсіювання" — символізуючи, що AI-ринок та ланцюги постачання вступають у подвійну трансформацію "децентралізації". Це не лише географічне розосередження, а й повна реструктуризація інвесторів, технологічних архітектур та промислової структури.

Кінець концентрації: "рахунок" на 725 мільярдів доларів та тривога щодо прибутковості

Щоб зрозуміти початок розподілення, спочатку потрібно побачити пік концентрації.

У 2026 році загальні капітальні витрати чотирьох гіперскейлерів очікуються в діапазоні від 650 до 700 мільярдів доларів, що становить приблизно 40% від загальних капітальних витрат індексу Russell 1000, що вдвічі більше рівня 2024 року. Конкретні цифри кожного: Amazon — близько 200 мільярдів доларів, Microsoft — 190 мільярдів доларів, Alphabet — збільшено до 175-185 мільярдів доларів, Meta — 125-145 мільярдів доларів.

Сам темп коригування цих цифр є важливим сигналом. Лише за останні приблизно шість місяців ринкові очікування щодо капітальних витрат хмарних провайдерів на 2026 рік зросли майже на 80%. Barclays прогнозує, що капітальні витрати основних хмарних провайдерів досягнуть 919 мільярдів доларів у 2027 році та приблизно 1,16 трильйона доларів у 2028 році. CreditSights оцінює, що у 2026 році приблизно 75% сукупних капітальних витрат гіперскейлерів буде спрямовано на AI-інфраструктуру, тобто близько 450 мільярдів доларів спеціалізованих витрат на AI.

Але концентрація масштабу стикається з питанням прибутковості. У червні 2026 року (за пекінським часом) акції Microsoft впали майже на 20% за місяць, а ринкова капіталізація зменшилася майже на 1,3 трильйона доларів за останні 8 місяців. Фокус уваги інвесторів — на капітальних витратах Microsoft у 2026 році обсягом близько 190 мільярдів доларів, з яких приблизно дві третини спрямовано на короткоциклічні активи, такі як GPU та CPU, які швидше амортизуються та безпосередньо прив'язані до короткострокового доходу. Валова рентабельність Microsoft Cloud вже знижена до 64%, що на 4 процентних пункти менше, ніж у попередньому році. Goldman Sachs у звіті за червень зазначив, що частка американських технологічних інвестицій у ВВП зросла приблизно до 4,9%, перевищивши пік періоду бульбашки доткомів навколо 2000 року.

Гранична віддача від концентраційних інвестицій знижується, що створює найбезпосередніший рушій для розподілення.

Точка перегину логіки: чому обчислювальні потужності мають стати розподіленими

Основна логіка розподілення AI-капітальних витрат — це насамперед зміна структури попиту на обчислювальні потужності.

Генеральний директор NVIDIA Дженсен Хуанг на GTC 2026 чітко заявив, що обсяг навантаження AI-інференції досягне мільярдних масштабів порівняно з навчанням, і настала ера інференції. IDC прогнозує, що до 2027 року завдання інференції займатимуть понад 70% загального попиту на інтелектуальні обчислення. Дані TrendForce ще конкретніші: у 2026 році річний приріст обчислювальних потужностей для AI-інференції сягне 122%, значно випереджаючи 56% приросту обчислювальних потужностей для AI-тренування.

Вимоги до інфраструктури для навчання та інференції кардинально відрізняються. Навчання — це централізоване, високощільне, тривале обчислювальне завдання, яке природно підходить для розгортання в гіпермасштабованих дата-центрах. Інференція — це розподілена, низьколатентна, високопаралельна задача реагування в реальному часі: коли AI-агенту потрібно виконати інференцію та повернути результат за десятки мілісекунд, фізична затримка передачі даних від крайового пристрою до централізованого дата-центру і назад стає непереборною перешкодою.

Архітектори Akamai вказують, що в ігрових сценаріях затримка першого токена має бути в межах 15 мілісекунд, для рекомендацій в електронній комерції — близько 20 мілісекунд, тоді як мережева затримка між традиційним централізованим дата-центром та кінцевим користувачем часто становить десятки мілісекунд, що робить неможливим подолання цього бар'єру в сценаріях взаємодії в реальному часі. При централізованому розгортанні 1 ГВт обчислювальних потужностей потребує 75 Тбіт/с вихідної пропускної здатності (Blackwell), а наступне покоління Vera Rubin — 135 Тбіт/с; при розподілі на 20 вузлів кожному потрібно лише 3,75 Тбіт/с. Це арифметична задача, продиктована законами фізики, а не вибір бізнес-стратегії.

Водночас мультимодальна взаємодія генерує величезні обсяги вихідного трафіку, а високі витрати на пропускну здатність у публічних хмарах стають "невидимим вбивцею" прибутковості AI-бізнесу. У поєднанні з постійним посиленням законів про локалізацію даних у ЄС (GDPR), Південно-Східній Азії, на Близькому Сході та в інших регіонах, централізоване розгортання опиняється в ситуації, коли важко одночасно забезпечити досвід, вартість і відповідність законодавству. AI-обчислення більше не зосереджуються лише в основних хмарах, а починають еволюціонувати до трирівневої розподіленої архітектури "ядро — регіон — край".

Від чотирьох гігантів до всього ланцюга: коло учасників капітальних витрат розширюється

Другий вимір розподілення — це поширення інвесторів.

Останні три роки інвестиції в AI-інфраструктуру майже повністю контролювалися чотирма великими хмарними провайдерами та NVIDIA. Але в 2026 році ця структура змінюється. За розрахунками CITIC Securities, у 2026 році сукупні AI-капітальні витрати MAG7 становитимуть приблизно 754,2 мільярда доларів, а китайські внутрішні AI-капітальні витрати — близько 805,8 мільярда юанів (приблизно 110 мільярдів доларів). Разом обидва шляхи дають внесок AI-капітальних витрат Китаю та США у ВВП Китаю приблизно 1 007,6 мільярда юанів, що становить 0,68% ВВП та маржинальний внесок у зростання ВВП близько 0,33 процентного пункту. Бізнес AI випередив ланцюги міських інвестицій, ставши маржинальним драйвером зростання ВВП.

Участь підприємств прискорюється. Останнє опитування RBC показує, що підприємства прискорюють впровадження AI, більшість перейшли від експериментів до повноцінного виробництва. Опитування японських компаній щодо використання AI показує, що 47,8% компаній досягли рівня повноцінного запуску, а серед великих компаній цей показник сягає 62,7%. Хоча впровадження серед малих та середніх підприємств все ще обмежене (близько 12% у Японії), показник у 64,7% серед великих компаній свідчить про те, що корпоративне впровадження AI перейшло від перевірки концепції до масштабування.

Не можна ігнорувати участь суверенних держав. Дженсен Хуанг на зборах акціонерів у червні 2026 року (за пекінським часом) повідомив, що майже 40 країн і регіонів, які разом представляють 50 трильйонів доларів ВВП, будують AI-фабрики, що працюють на інфраструктурі NVIDIA. Інвестиції в AI-інфраструктуру перетворюються з "внутрішньої справи технологічних компаній" на "стратегічну конкуренцію на рівні держав".

Розподілення капітальних витрат також відображається в структурі фінансування. CITIC Securities зазначає, що капітальні витрати американських AI-гігантів вступили в фазу, коли вони фінансуються за рахунок боргу. Капітальні витрати гіперскейлерів більше не повністю залежать від вільного грошового потоку, а використовують боргове фінансування для збільшення левериджу. Така зміна моделі фінансування означає, що стійкість капітальних витрат більше не залежить виключно від грошового потоку окремої компанії, а пов'язана з ширшим середовищем кредитного ринку.

Край — це передова: впровадження розподіленої AI-інфраструктури

Найконкретніший прояв тенденції розподілення спостерігається у сфері крайових обчислень.

У 2026 році крайовий AI переходить від концепції до масштабного розгортання. "AI-мережа", створена спільно Akamai та NVIDIA, вже впроваджена, перетворюючи глобальну мережу з понад 4 400 крайових вузлів на розподілену платформу для AI-інференції. Akamai трансформується з провідного глобального постачальника хмарних послуг доставки на найбільшу у світі розподілену платформу AI-інференції, вже масштабно розгорнувши NVIDIA Blackwell RTX 6000 PRO GPU.

Ця трансформація не є унікальною. У червні 2026 року (за пекінським часом) компанія крайових інтелектуальних обчислень Yuntian Changxiang завершила фінансування серії E на суму понад 10 мільярдів юанів під керівництвом Китайського фонду інтернет-інвестицій. Компанія одночасно оголосила про повний перехід від "постачальника послуг крайових інтелектуальних обчислень" до стратегічного плану "плетіння мережі інтелектуальних обчислень реального часу" для ери AGI. Antimatter отримала 300 мільйонів євро на розгортання перших 100 розподілених мікродата-центрів Policloud у 2026 році. NXP через придбання Kinara посилила свій портфель крайових AI-рішень, додавши автономні NPU.

IDC прогнозує, що до 2027 року понад 80% підприємств розгорнуть розподілену крайову інфраструктуру. Темпи зростання будівництва крайової інфраструктури перевищать темпи основних дата-центрів. Це означає, що край перестає бути доповненням до хмари, а стає ключовим компонентом AI-інфраструктури.

Бізнес-логіка крайового AI зрозуміла: завдання інференції набагато чутливіші до затримки, ніж навчання, а крайові вузли природно знаходяться ближче до джерел даних і користувачів. Для підприємств крайове розгортання також вирішує проблеми відповідності даних (дані не залишають країну), вартості пропускної здатності (зменшення передачі в хмару) та надійності (локальне відновлення після збоїв). Ці проблеми важко вирішити одночасно в централізованій архітектурі, але знаходять практичне рішення в розподіленій архітектурі.

Ера багаторівневої інфраструктури: структурна зміна інвестиційної логіки

AI-інфраструктура переходить від "єдиної централізованої" до "багаторівневої розподіленої" структури. Цей перехід має глибокий вплив на інвестиційну логіку.

По-перше, змінюється структура попиту на чіпи. З боку навчання домінування GPU NVIDIA зберігається — у 2026 фінансовому році дохід NVIDIA від дата-центрів склав 193,7 мільярда доларів, збільшившись на 68% у річному обчисленні. Але різноманітний попит з боку інференції створює додатковий ринок для ASIC та крайових чіпів. Інститути прогнозують, що у 2026 році обсяги поставок ASIC-чіпів становитимуть приблизно 7,7 млн одиниць, що відповідає частці 45%, і у 2027 році перевищать частку GPU, досягнувши 58%. Broadcom може зайняти близько 60% ринку ASIC-чіпів для AI-серверів до 2027 року.

По-друге, змінюється географічний розподіл інвестицій в інфраструктуру. Гіпермасштабовані дата-центри продовжують розширюватися — загальний обсяг інвестицій у дата-центри у світі, за прогнозами, досягне 1,6 трильйона доларів до 2030 року — але будівництво крайових вузлів зростає швидшими темпами. AI-обчислення більше не зосереджуються лише в основних хмарах, а поширюються на трирівневу архітектуру "ядро — регіон — край".

По-третє, змінюється період оцінки прибутковості інвестицій. Інвестиційний цикл централізованих дата-центрів тривалий, з високою капіталомісткістю, і знадобиться кілька років, щоб окупити витрати. Натомість крайові AI-розгортання зазвичай менші за масштабом, мають коротший цикл і тісніше пов'язані з конкретними бізнес-сценаріями, що дозволяє більш детально оцінювати прибутковість. Ця різниця змінює логіку оцінки AI-інвестицій на ринку капіталу — від "хто витратив найбільше" до "хто витрачає найефективніше".

Дані Research and Markets показують, що світовий ринок AI-інфраструктури зросте з 71,88 мільярда доларів у 2025 році до 90,91 мільярда доларів у 2026 році. Але ця цифра охоплює лише вузький ринок апаратного забезпечення інфраструктури. Якщо врахувати корпоративні AI-розгортання, крайові обчислення, галузеві рішення тощо, масштаб розподілення AI-капітальних витрат набагато перевищує цю цифру.

Ризики та обмеження: розподілення — не легкий шлях

Тенденція розподілення AI-капітальних витрат зрозуміла, але не без обмежень.

Вузькі місця з боку пропозиції все ще залишаються. Постачання серії NVIDIA Blackwell залишається напруженим, і дефіцит триватиме кілька кварталів. Потужності з виробництва ключових компонентів, таких як HBM, вже заброньовані великими клієнтами до 2026 або навіть 2027 року. Bernstein Research зазначає, що лише зростання цін на HBM може збільшити AI-капітальні витрати гіперскейлерів приблизно на 30%.

Енергетична інфраструктура — ще одне обмеження. Попит на електроенергію для AI-дата-центрів наближається до межі існуючих електромереж. Підключення централізованого кластера потужністю 1 ГВт само по собі є проектом, що триває кілька років. Розподілена архітектура знижує потреби в електроенергії на окремому вузлі, але висуває нові вимоги до можливостей розподіленого приєднання до мережі.

Геополітичні ризики також не можна ігнорувати. Експортні обмеження США на передові AI-чіпи продовжують впливати на глобальні ланцюги постачання. NVIDIA у звіті за перший квартал 2027 фінансового року чітко виключила вплив доходів від китайського бізнесу дата-центрів. Хоча AI-капітальні витрати Китаю та США тісно взаємопов'язані, політична невизначеність збільшує транзакційні витрати в ланцюгах постачання.

Нарешті, терпіння ринку капіталу щодо прибутковості AI-інвестицій скорочується. Goldman Sachs чітко зазначає, що основний конфлікт на ринку AI загострюється — фундаментальні показники все ще сильні, але ринок уже заклав занадто багато майбутніх доходів. З листопада 2022 року ринкова капіталізація AI-компаній зросла на 27 трильйонів доларів, що значно перевищує 9 трильйонів доларів, оцінених на основі макроекономічних базових показників. Якщо розподілені інвестиції не призведуть швидше до доходів і прибутку, ставлення ринку капіталу може змінитися від "ставити під сумнів масштаб" до "ставити під сумнів логіку".

Висновок

Розподілення AI-капітальних витрат не є запереченням концентрації, а її доповненням і продовженням.

Навчання все ще потребує гіпермасштабованих дата-центрів, а інференція переходить на край; гіганти продовжують нарощувати обсяги, а підприємства та суверенні держави входять на ринок; GPU залишаються основною силою для навчання, а ASIC та крайові чіпи відкривають нові напрямки. Це ера багаторівневої інфраструктури — різні рівні виконують різні функції, різні учасники займають різні екологічні ніші.

2026 рік є ключовим моментом цього структурного переходу. DIGITIMES прогнозує, що зростання капітальних витрат на світовому AI-ринку сповільниться з 66% у 2025 році до 31% у 2026 році, але сповільнення не означає зупинки. Навпаки, сповільнення темпів часто свідчить про те, що галузь переходить від "грубого розширення" до "точного будівництва". AI-інфраструктура перетворюється з концентрованого ринку, де "переможець отримує все", на екосистему "рівневої співпраці".

Для інвесторів розуміння цього структурного зсуву може бути важливішим, ніж відстеження цифр капітальних витрат наступного кварталу. Розподілення AI-капітальних витрат змінює довгострокову інвестиційну логіку в хмарних обчисленнях, дизайні чіпів, корпоративній IT-архітектурі та навіть національній промисловій політиці. Кінець цих змін поки невідомий, але їхній напрямок вже достатньо зрозумілий.

FAQ

Q1: Яка основна рушійна сила розподілення AI-капітальних витрат?

Вибуховий попит на інференцію є ключовим рушієм. У 2026 році річний приріст обчислювальних потужностей для AI-інференції становить 122%, значно перевищуючи 56% для навчання. Потреба інференції в низькій затримці та високому паралелізмі створює фізичне вузьке місце для централізованих дата-центрів, роблячи розподілені крайові вузли неминучим вибором. Водночас такі фактори, як відповідність даних та вартість пропускної здатності, також сприяють децентралізації обчислень.

Q2: Які саме капітальні витрати чотирьох великих хмарних провайдерів у 2026 році?

Amazon — близько 200 мільярдів доларів, Microsoft — близько 190 мільярдів доларів, Alphabet — близько 175-185 мільярдів доларів, Meta — близько 125-145 мільярдів доларів. Разом близько 725 мільярдів доларів, що на 77% більше, ніж у 2025 році. Приблизно 75% з цього спрямовано на AI-інфраструктуру.

Q3: Як співвідносяться крайовий AI та хмарні обчислення?

Вони є взаємодоповнюючими, а не замінними. Основна хмара відповідає за навчання великих моделей та складну інференцію, тоді як крайові вузли забезпечують низьколатентну реакцію в реальному часі, попередню обробку даних та локальне забезпечення відповідності. AI-обчислення еволюціонують до трирівневої розподіленої архітектури "ядро — регіон — край", формуючи екосистему рівневої співпраці.

Q4: Як розподілення AI-капітальних витрат впливає на індустрію чіпів?

З боку навчання домінування GPU NVIDIA зберігається — дохід від дата-центрів у 2026 фінансовому році склав 193,7 мільярда доларів. Але попит з боку інференції створює додатковий ринок для ASIC та крайових чіпів. Очікується, що у 2026 році обсяги поставок ASIC становитимуть близько 7,7 млн одиниць, а у 2027 році їхня частка може перевищити частку GPU. Попит на чіпи переходить від "єдиного лідера" до "множинного співіснування".

Q5: Як довго може тривати високе зростання інвестицій в AI-інфраструктуру?

Barclays прогнозує, що капітальні витрати основних хмарних провайдерів досягнуть 919 мільярдів доларів у 2027 році та піднімуться до приблизно 1,16 трильйона доларів у 2028 році. Керівництво NVIDIA підвищило верхню межу річних витрат галузі AI до 4 трильйонів доларів до 2030 року. Але самі темпи сповільнюються — з 66% у 2025 році до 31% у 2026 році — галузь переходить від "грубого розширення" до "точного будівництва".

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено