SemiAnalysis: Від інфраструктури до рівня моделей, міграція багатства в ланцюжку вартості ШІ прискорюється.

AI-індустрія переживає структурний зсув у центрі ваги цінності.

За останні два роки NVIDIA, виробники пам'яті та постачальники енергії домінували в розподілі прибутку від інвестицій в AI, але з прискоренням комерціалізації агентного AI (Agentic AI) простір прибутку на рівні моделей розширюється безпрецедентними темпами. Тим часом NVIDIA та TSMC, які контролюють пропозицію обчислювальних потужностей, ще не повністю відобразили цю тенденцію у своєму ціноутворенні.

Anthropic є найбільш прямим підтвердженням цього зсуву. Згідно з останнім дослідженням SemiAnalysis, річна виручка (ARR) Anthropic зросла з 9 мільярдів доларів на початку року до понад 44 мільярдів доларів, а валова маржа її інфраструктури висновків за той самий період зросла з 38% до понад 70%. Водночас вартість виробництва токенів різко скоротилася завдяки вдосконаленню обладнання та програмного забезпечення, розрив між цінністю та вартістю продовжує зростати, що виводить виробників моделей на новий етап швидкого підвищення норми прибутку.

На стороні пропозиції NVIDIA та TSMC володіють найдефіцитнішими ресурсами, але ще не відреагували на поточний попит адекватним ціноутворенням. SemiAnalysis вважає, що це відставання в ціноутворенні створює важливий ринковий дисбаланс: системи наступного покоління, такі як Vera Rubin (VR NVL72), мають значний простір для підвищення ціни, і те, хто зможе скористатися цим перерозподілом цінності, глибоко вплине на інвестиційну логіку в ланцюжку AI-індустрії.

Трирічний шлях міграції пулу цінності AI

З 2023 по 2025 рік надлишковий прибуток від інвестицій в AI зосереджувався переважно на рівні інфраструктури.

У травні 2023 року NVIDIA вперше опублікувала вражаючий фінансовий звіт, акції зросли на 25% після закриття, що офіційно започаткувало хвилю інвестицій в AI. У 2024 році Vistra та GE Vernova зросли на 265% і 146% відповідно, увійшовши до числа найсильніших акцій S&P 500, а енергетичні обмеження стали фокусом ринку. У 2025 році сектор пам'яті став лідером зростання: SanDisk, Western Digital, Seagate та Micron показали річне зростання понад 200%, а дисбаланс попиту та пропозиції на пам'ять став ключовим фактором ціноутворення.

Водночас валова маржа виробників моделей та провайдерів послуг висновків тривалий час перебувала під тиском. На той час критики вважали, що реальна корисність AI — це не більше ніж "кращий Google Пошук" з чат-інтерфейсом, що сильно розходилося з очікуваними капітальними витратами в трильйони доларів.

Ця ситуація кардинально змінилася наприкінці 2025 року.

Агентний AI: поворотний момент для переосмислення економіки токенів

SemiAnalysis вважає грудень 2025 року справжнім поворотним моментом для комерціалізації AI — агентний AI почав стабільно працювати та масово впроваджуватися в корпоративні робочі процеси. Головне значення цієї зміни полягає в тому, що вона фундаментально змінила економічну цінність токенів.

На прикладі SemiAnalysis: їхні річні витрати на токени вже становлять приблизно 30% від загальної суми зарплат співробітників, а щомісячне споживання токенів на одного працівника перевищує 5 мільярдів, що в 5 разів більше за середній показник Meta. Дослідницька група навела кілька реальних прикладів: робота, яка раніше вимагала кількох годин роботи молодшого аналітика (фінансове моделювання, створення діаграм, аналіз прибутків), тепер виконується агентами з дуже низькою вартістю токенів, тоді як аналогічні витрати на людську працю становили сотні або тисячі доларів.

Водночас вартість виробництва токенів різко падає. SemiAnalysis оцінює, що в сценарії завдань агентів фактична змішана ціна запуску Opus 4.7 становить близько 0,99 долара за мільйон токенів, що значно нижче офіційної ціни в 5/25 доларів — причина в тому, що робоче навантаження агентів має дуже високе співвідношення введення/виведення (близько 300:1) і понад 90% кеш-хітів, тому велика кількість токенів потрапляє в найнижчий ціновий діапазон.

Прискорення на рівні обладнання також значне. Порівняно з H100 річної давнини, серія Blackwell може генерувати приблизно в 30 разів більше токенів за секунду на передових робочих навантаженнях. Подальше порівняння показує, що найбільш оптимізований GB300 NVL72 у порівнянні з найбільш оптимізованим H100 у точності FP8 збільшує пропускну здатність приблизно в 17 разів, а при переході на FP4 цей розрив зростає до 32 разів, при цьому загальна вартість володіння (TCO) вища лише приблизно на 70%.

Двосторонній розрив між цінністю та вартістю — це ключовий рушій, який підняв валову маржу Anthropic з 38% до понад 70%.

Ціноутворювальна влада модельного рівня: чому конкуренція не з'їсть її

Зіткнувшись зі швидким розширенням норми прибутку виробників моделей, найпоширеніший скептицизм ринку полягає в тому, що конкуренція зрештою знизить ціни. SemiAnalysis має застереження щодо цього і наводить два аргументи.

По-перше, ціноутворювальна влада передових закритих моделей залишається міцною. Хоча показники бенчмарків відкритих моделей постійно оновлюються, їхня продуктивність у реальних сценаріях інтелектуальної роботи все ще значно слабша за передові закриті моделі. Наприклад, Kimi K2.6 (ціна 0,95/4 долари) лише незначно тисне на ціну Anthropic Opus.

По-друге, обмеження обчислювальної потужності означає, що жодна передова лабораторія не може самостійно задовольнити попит усього ринку. Anthropic вже почала активно управляти попитом, обмеживши Claude Code щомісячною підпискою понад 100 доларів і обмеживши доступ третіх сторін. У найближчому майбутньому попит на токени продовжить перевищувати пропозицію. Ця структурна дефіцитність дає виробникам передових моделей впевненість ціноутворення за цінністю, а не за вартістю.

Anthropic вже реалізувала цю логіку через стратегію лінійки продуктів: ціна Opus fast у 6 разів вища за звичайний Opus, майбутній Mythos коштуватиме 25/125 доларів, що в 5 разів вище за звичайний Opus, і провідні корпоративні клієнти все одно готові платити за ці дорогі SKU. SemiAnalysis зазначає, що якби Anthropic встановила ціну Mythos fast на рівні 150/750 доларів, вона сама була б платним користувачем.

NVIDIA та TSMC: відставання в ціноутворенні дефіцитних ресурсів

Однак дві компанії, які контролюють найбільш дефіцитні ресурси — NVIDIA та TSMC — ще не повністю скористалися цією хвилею переоцінки.

Передові виробничі потужності TSMC N3 стали найбільш вузьким місцем у розширенні обчислювальних потужностей AI. NVIDIA, Broadcom, Annapurna, MediaTek і AMD змагаються за обмежені квоти на пластини N3, і очікується, що завантаження потужностей N3 перевищить 100% у другій половині 2026 року. Завантаження заводів DRAM вже перевищує 90%, загальна пропозиція пам'яті обмежена, але ціноутворення відносно консервативне.

SemiAnalysis вважає, що TSMC має всі умови для значного підвищення цін, і клієнти не тільки приймуть це, а деякі навіть вітатимуть — приклад NVIDIA: якщо підвищення цін TSMC означає менші квоти для конкурентів, то вища ціна на пластини для NVIDIA насправді зміцнить її ринкову позицію. Генеральний директор NVIDIA Дженсен Хуан у 2024 році публічно заявив, що TSMC має підвищити ціни на пластини, і логіка цього саме така.

Власна стратегія ціноутворення NVIDIA також демонструє подібну консервативність. SemiAnalysis зазначає, що ціноутворювальна рамка NVIDIA все ще базується на попередньому припущенні, що "готівка платити за одиницю обчислювальної потужності з часом знижуватиметься", але це припущення більше не діє. З вибухом робочого навантаження агентного AI попит на обчислювальну потужність більше не є лінійним, а демонструє складне прискорення.

Система Rubin: кількісна оцінка простору для ціноутворення Nvidia

Використовуючи майбутню Vera Rubin (VR NVL72), яка вийде в другій половині 2026 року, як еталон, SemiAnalysis побудував рамку ціноутворювального аналізу "Один графік, щоб керувати всіма" (One Chart to Rule Them All), яка визначає нижню та верхню межу орендної ціни з точки зору вартості та цінності.

Нижня межа (вартість): виходячи з порогу внутрішньої норми прибутку (IRR) для проектів Neocloud (нових хмарних провайдерів) не нижче 15,6%, мінімальна орендна ціна за годину на один GPU для VR NVL72 має становити приблизно 4,92 долара, щоб підтримувати готовність Neocloud до розгортання.

Верхня межа (цінність): використовуючи поточну орендну ціну за 5-річним контрактом для GB300 приблизно 0,70 долара за PFLOP як якір, верхня межа орендної ціни для VR NVL72 становить приблизно 12,25 долара за годину на один GPU.

Поточна ціна системи VR NVL72 знижує вартість на PFLOP лише до приблизно 0,28 долара, що на 60% менше, ніж у GB300 NVL72, що значно перевищує покращення історичного тренду. Це означає, що ціна серверів Nvidia має простір для підвищення приблизно на 40%, навіть після підвищення ціни Neocloud залишиться достатній запас прибутку, а загальне покращення вартості все ще буде нижчим за історичний тренд.

Ціноутворення пам'яті SOCAMM є ще одним ключовим фактором. VR NVL72 використовує модулі пам'яті LPDDR5X (SOCAMM) з роз'ємами, які можна ціноутворювати незалежно від обчислювальних блоків. SemiAnalysis оцінює, що контрактна ціна SOCAMM, яку Nvidia платила в першому кварталі 2026 року, становить приблизно 8 доларів за ГБ, що є значним стрибком порівняно з попереднім кварталом; очікується, що до кінця 2026 року ціна SOCAMM може перевищити 13 доларів за ГБ. У цьому контексті 60% валова маржа Nvidia на SOCAMM логічно обґрунтована: з одного боку, пропозиція пам'яті обмежена, а Nvidia має найбільшу частку; з іншого боку, лідируюча продуктивність VR NVL72 з точки зору TCO залишає клієнтів без альтернативи.

Хто виграє, хто чекає: визначення приналежності цінності

Рамка SemiAnalysis виявляє основний конфлікт у поточному розподілі цінності AI: покращення економіки токенів швидко підвищує прибутки виробників моделей, провайдерів послуг висновків та Neocloud, але ціноутворювальна поведінка NVIDIA та TSMC, як власників найдефіцитніших ресурсів на стороні пропозиції обчислювальних потужностей, має очевидний дисбаланс з дефіцитністю їхньої пропозиції.

Тривалість цього дисбалансу по суті є свідомим вибором — Nvidia грає роль, подібну до "центрального банку AI", передаючи цінність нижче за течією через підвищення ефективності програмного забезпечення, щоб підтримувати довгостроковий імпульс зростання екосистеми та уникати антимонопольного тиску. TSMC продовжує свою історичну філософію ціноутворення "стабільна екосистема, не використовувати весь потенціал зростання".

Однак, оскільки ROI висновків стає все більш очевидним, а логіка ціноутворення за цінністю поширюється на ринку, тиск на ці дві компанії щодо переходу до рамки ціноутворення за цінністю продовжить зростати. Як тільки перехід відбудеться, структура розподілу цінності в ланцюжку AI-індустрії знову зміниться — тоді переговорна сила на стороні пропозиції обчислювальних потужностей більшою мірою повернеться до рівня обладнання.

Ризики та застереження

        Ринок несе ризики, інвестуйте обережно. Ця стаття не є інвестиційною рекомендацією і не враховує особливі інвестиційні цілі, фінансовий стан або потреби окремих користувачів. Користувачі повинні враховувати, чи відповідають будь-які думки, погляди або висновки в цій статті їхній конкретній ситуації. Інвестування на основі цього здійснюється на ваш власний ризик.
TOKEN-3,03%
VR-0,37%
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено