Коли закінчиться «вічна слава» американському ринку акцій чипів

Автор: Sun Cheng; джерело: Barrons Бэронс

Квітневий ринок акцій США був занурений у структурний бум під керівництвом ШІ, індекс Nasdaq зріс на 15,3% за місяць, S&P 500 піднявся на 10,4%, а індекс напівпровідників Філадельфії встановив новий рекорд з найбільшим місячним зростанням з 2000 року. Після травня сценарій ринку швидко змінився: три основні індекси США коливаються на високих рівнях, під поверхнею спокій, але під водою киплять хвилі: акції ARM, завдяки позитивним фінансовим звітам, стрімко зросли на 42,58% за тиждень, лідери зберігання даних, такі як SanDisk і Seagate, піднялися більш ніж на 15% за тиждень, тоді як колишні лідери AI, Nvidia і Microsoft, зазнали падінь.

Чи це згасання основної лінії AI, чи глибока внутрішня зміна? Капітал перетікає з GPU і хмарних гігантів у архітектуру ARM і чіпи для зберігання даних, ринок, здається, торгує новою логікою «пік обчислювальної потужності для тренування, перехід до інференції на кінцевих пристроях і зберігання». Чи означає новий максимум індексу Dow, що стильова ротація вже почалася? Стрімке зростання ARM — це початок переоцінки цінності або вершина короткострокового бульбашки?

Важливі точки:

  1. Бум AI ще не закінчився, але входить у фазу тонкої диференціації: капітал продовжує інвестувати у AI, але вже не в загальному масштабі, а вибірково. Внутрішньо ринок переходить від GPU і хмарних гігантів до ARM і чіпів для зберігання даних, логіка торгівлі змінюється на «пік обчислювальної потужності для тренування, перехід до інференції і зберігання».

  2. Сильний ефект колективної концентрації капіталу, але об’єкти змінюються: алгоритмічна торгівля, опціони на кінцеві дати і леверидж-фонди змінюють ринкову екосистему, хеджування маркет-мейкерів посилює коливання. Ефект колективної концентрації не зник, а перемістився з Nvidia та інших бенчмарків до нових гарячих точок, таких як ARM і SanDisk, що викликає «зростання до рівня, що руйнує уявлення».

  3. Стрімке зростання ARM — типова «примусова коротка» ситуація, яка не може тривати довго: гамма-стискання і короткі позиції накладаються один на одного, спричиняючи короткостроковий сплеск цін. Такий тренд не може тривати вічно; при виснаженні покупців або зміні настроїв ціна може швидко повернути вниз, тому потрібно бути дуже обережним.

  4. Архітектура ARM має суттєві переваги у пер inference на кінцевих пристроях: як RISC-архітектура з меншою енергоефективністю ніж x86, так і модель ліцензування IP, що дозволяє кастомізацію та гібридний дизайн; оптимізація матричних обчислень краще підходить для трансформерних моделей. Довгостроковий поворот у галузі вже сформувався, але короткострокові коливання цін дуже сильні.

  5. Позиція Nvidia у тренуванні стабільна, але інференція викликає виклики: екосистема CUDA важка для подолання, і у тренуванні немає реальних конкурентів. Однак у сфері інференції AMD, Google і Microsoft, які розробляють власні чіпи, отримують можливості через «довгий час страждань Nvidia», і хоча частка Nvidia зменшиться, вона залишиться лідером.

  6. Обчислювальні навантаження на інференцію вже перевищують тренування: зараз співвідношення приблизно 6:4, але капітальні витрати все ще переважають у тренуванні — 60%. З поширенням великих моделей і розвитком агентного AI, а також уповільненням тренувальних ітерацій, високі вимоги до вартості, енергоспоживання і затримки для інференції створюють нові можливості для ARM і зберігання даних.

Огляд ринку: чи початок чи бульбашка AI?

Sun Cheng: Чи закінчився бум зростання під керівництвом AI? Капітал з GPU/хмарних гігантів перетікає у ARM і зберігання, у чому основна рушійна сила?

Мяо Мей: З 2023 року американський ринок почав активно фокусуватися на AI. Найяскравішою акцією 2023 року була Nvidia, яка належить до напівпровідників, але головним драйвером є AI. Ця хвиля триває з того часу і до 2024-2025 років, і зараз вона проявляється у багаторівневому і ритмічному розгортанні. Тому говорити, що бум AI закінчився, ще зарано.

З нашими останніми даними за минулу п’ятницю, інвестиції у AI ще не показують ознак ослаблення. Але тут є важлива особливість — «диференціація у диференціації». З 2022 року основний ринок США перебуває у стані застою, з жовтня по лютий — у горизонтальному діапазоні. Під час цього застою деякі софтверні компанії і великі технології, що постраждали від AI, вже зазнали корекції і відкатів. Але одночасно, у той самий час, коли ринок був у застої або падав, деякі популярні сегменти AI, наприклад, зберігання і оптоволоконні комунікації, не падали, а зростали, що свідчить про диференціацію і перерозподіл капіталу.

Отже, з точки зору капіталу, і нові, і існуючі інвестори залишаються дуже активними. Але ринок демонструє тенденцію — у межах великої секції AI капітал постійно шукає нові гарячі точки, диференціацію і нові теми. Тому бум ще не закінчився, а перейшов у більш тонку і деталізовану фазу.

Sun Cheng: Nasdaq і S&P 500 показали найкращий місячний результат за майже шість років, а індекс напівпровідників Філадельфії — найбільше місячне зростання з 2000 року. Що стоїть за цим екстремальним ринковим рухом, окрім AI? Як проявляються емоції ринку і ефект колективної концентрації капіталу? Після середини травня ринок не продовжив загальне зростання — чи означає це перехід від «загальної оптимістичної» до «вибіркової» стратегії? Чи зберігається ефект колективної концентрації?

Мяо Мей: Це можна розглянути з двох сторін. По-перше, це типова технічна ситуація на ринку США. Зазвичай після тривалого застою і падінь ринок починає різке відновлення, наприклад, у 2020 році або після тримісячної корекції у серпні-жовтні 2023 року, що закінчилася майже піврічним бумом. З жовтня 2022 року ринок США перебуває у стані застою, з фокусом у кілька місяців без змін — це класична підготовка до нового зльоту. Останній обвал у березні був серйозною корекцією оцінки, і 30 березня став дном цієї хвилі. Тому з квітня почався відновлювальний бум, що є своєрідною корекцією попередніх півроку застою. Важливо, що ринок США має характер «залишайся у грі», тобто потрібно залишатися в ринку, бо відскок може статися за один-два дні. Статистика показує, що за останні 50, 30 або 10 років, якщо пропустити кілька днів або тижнів найбільших відскоків і бумів, річний дохід буде суттєво нижчим.

По-друге, ефект колективної концентрації капіталу все ще існує, але ринок зараз зовсім інший, ніж раніше. Алгоритмічна торгівля, торгівля за допомогою програм, масова участь роздрібних інвесторів і величезна кількість опціонів і леверидж-фондів кардинально змінили ринкову екосистему. Маркет-мейкери, щоб хеджувати ризики, змушені вживати певних заходів, що посилюють коливання — і підйоми, і спади. Особливо у популярних акціях AI, всі роздрібні інвестори активно торгують опціонами на кінцеві дати, а великі гравці (з великим капіталом і впливом) також переслідують ці гарячі теми. Це сприяє швидкому зростанню і падінню цін, і останнім часом ефект колективної концентрації став ще сильнішим — «зростання до рівня, що руйнує уявлення». Тому ринок не став песимістичним, а змінив об’єкти концентрації — капітал все ще зосереджений, але у нових компаніях і темах.

Sun Cheng: Акції ARM за один тиждень зросли більш ніж на 42%, досягнувши такого зростання за два торгові дні. Це вже технічно можна вважати «примусовою короткою» ситуацією? Чи є тут підтримка з боку роздрібних інвесторів або опціонного гамма-стискання? Чи можливо таке швидке зростання тримати довше?

Мяо Мей: Це справді класична ситуація «примусового короткого» зростання, де важливу роль відіграє гамма-стискання. У сучасному ринку США, коли з’являється гаряча тема, всі інституційні і великі гравці, і роздрібні інвестори активно її купують. Величезна кількість опціонів на кінцеві дати створює проблему гамма-стискання. Маркет-мейкери, які не ставлять на напрямок, а заробляють на різниці цін, стикаються з великим ризиком: якщо акція зростає, їм потрібно виконати опціони і купити акції для хеджування (зберігаючи дельту нейтральною). Чим більше купують, тим більше потрібно купувати акцій, і ціна починає стрімко зростати. Останні ефекти у передзакриткових хвилинах — це саме наслідок цього гамма-стискання. Коли ціна знову зростає, інвестори, захоплені успіхом, починають ще активніше купувати опціони на зростання, що ще більше підсилює покупку акцій маркет-мейкерами.

Крім того, є коротке зчеплення: деякі інвестори, вважаючи, що ціна явно відхиляється від оцінки, відкривають короткі позиції, але через механізми вище ціна продовжує зростати, і вони змушені закривати позиції, купуючи акції, що викликає ще більше короткого зчеплення. У випадку ARM, якщо така динаміка триватиме довше і буде більш крутою, це стане типовим прикладом «примусового короткого» зростання.

Щодо стійкості, з технічної точки зору, така ситуація не може тривати вічно. Коли всі короткі позиції закінчаться або нові покупці втратять довіру через коливання цін, ринок втратить баланс і ціна швидко повернеться вниз, особливо при фіксації прибутків або зміні настроїв. Це явище має ефект наслідування і може посилюватися, тому потрібно бути дуже обережним.

Глибока аналітика AI-технологій: зростання ARM, тиск Nvidia, роль зберігання

Sun Cheng: Минулого тижня ARM зросла на 42,58%, і ключова логіка ринку — «перехід AI з тренування до інференції на кінцевих пристроях, що принесе великі вигоди ARM». З технічної точки зору, у чому полягають суттєві переваги архітектури ARM у порівнянні з x86 у сценаріях AI inference? Чи є ця переоцінка цінності короткостроковою через фінансові звіти, чи це довгостроковий поворот у галузі?

Ван Хуай: З технічної точки зору, зараз ринок орієнтується на застосування AI для inference на кінцевих пристроях, і ця логіка цілком очевидна. Три основні переваги ARM перед x86 у цій сфері:

Перше,指令ний набір. ARM — RISC (скорочений набір інструкцій), тоді як x86 — CISC (складний набір інструкцій). RISC не вимагає надмірної складності конвеєра, тому на одному й тому ж об’ємі чипа можна розмістити більше ядер, кешів або прискорювачів, що сприяє близькому до пам’яті обчисленню. У сценаріях inference головним вузлом є пам’ять і її швидкість. ARM має гнучкий фізичний IP і можливості кастомізації, що робить його природним вибором для AI-обчислень. У типових навантаженнях ARM-архітектура значно енергоефективніша за x86, споживаючи майже вдвічі менше енергії, що дає суттєву економію.

Друге, переваги ліцензування. ARM — ліцензована модель IP, що дозволяє клієнтам створювати кастомізовані рішення, наприклад, поєднання CPU, GPU і NPU. У той час як x86 — «чорний ящик», важко модифікувати або гібридизувати його для глибокої оптимізації. Відкритість ARM сприяє більшій популярності при інтеграції високошвидкісної пам’яті (LPDDR).

Третє, оптимізація матричних обчислень. У трансформерних моделях найбільше використовуються матричні множення, і оптимізація ARM у цій сфері значно ефективніша, ніж у x86. Хоча x86 також може ефективно виконувати матричні операції, досягти такої ж енергоефективності і площі при аналогічній пропускній здатності важче, ніж на векторних рішеннях ARM. Якщо важлива сумісність і зрілість — вибирайте x86; якщо ж важливі ціна і енергоспоживання (майбутні великі витрати) — переваги ARM очевидні.

З довгострокової перспективи, AI переходить від тренування до inference, особливо у розвитку Agentic AI (агентного штучного інтелекту). Це не лише діалогові системи, а й багато API-запитів, мережевих і файлових викликів, що залежать від CPU. ARM як CPU має великі перспективи у застосуваннях AI на кінцевих пристроях (ПК, смартфони, автомобілі). Я вважаю, що цей тренд правильний, і галузь вже усвідомила довгостроковий поворот. Але короткострокові коливання цін будуть дуже сильними, а довгострокова цінність закріпиться з часом. Це — ваги, а не голосування настроїв.

Sun Cheng: Nvidia минулого тижня знизилася на 2,58%, ринок побоюється уповільнення зростання. AMD піднялася на 3,60%. Чи залишається екосистема CUDA Nvidia міцною у сфері AI? Чи зможуть GPU серії MI AMD у inference скоротити відставання? Наскільки серйозною є загроза для Nvidia з боку власних чіпів для внутрішнього використання клієнтами?

Ван Хуай: У тренувальній сфері наразі ніхто не може похитнути позиції Nvidia. Але з поширенням великих моделей і розвитком Agentic AI потреби у inference зростають значно, і це відкриває можливості іншим гравцям. В inference потрібна складна гібридна архітектура CPU, GPU, NPU і високі вимоги до пам’яті. Це дає AMD і іншим шанс отримати свою частку.

AMD, безумовно, виграє від настрою «весь світ страждає від Nvidia», оскільки компанії потрібен надійний другий постачальник для безпеки ланцюга поставок і уникнення залежності від одного. Вже зараз AMD демонструє високі темпи зростання у дата-центрах, хоча загальний дохід поки що значно нижчий за зростання цін акцій — це і емоційний фактор, і реальні можливості. В цілому, ринок визнає великі можливості у inference, і AMD отримує свою частку.

Щодо Nvidia, частка у продажах inference зменшиться, але не критично. Екосистема CUDA — не таке швидке для подолання, і Google, Microsoft, Amazon розробляють власні чіпи для inference, щоб зменшити залежність і створити кастомізовані рішення під свої сценарії. Це очевидний тренд. Але універсальні і найпоширеніші чіпи залишаються Nvidia. У найближчі два-три роки Nvidia зберігатиме домінування у inference, хоча частка може зменшитися, і концентрація у тренуванні залишиться високою. В короткостроковій перспективі конкуренції у тренуванні немає.

Sun Cheng: Ринкова думка стверджує, що інвестиції у AI зараз зосереджені на «обчислювальній потужності для тренування», а не для inference. Який приблизний розподіл навантаження між тренуванням і inference у глобальному масштабі? Як ця пропорція зміниться у найближчі два роки? Які нові технічні виклики виникають для чіпів, пам’яті і енергоспоживання через цей перехід?

Ван Хуай: За даними кількох звітів, співвідношення обчислювальних навантажень inference до тренування — приблизно 6:4 або 5,5:4, тобто inference вже перевищує тренування. Але капітальні витрати (Capex) навпаки — у тренуванні: 60% проти 40%, оскільки тренування великих моделей вимагає дуже дорогих суперкомп’ютерів.

У майбутньому ця пропорція значно зросте на користь inference. По-перше, поширення великих моделей ще дуже низьке — понад 86% населення світу ніколи не користувалося ними. Крім Китаю і США, багато країн мають дуже низький рівень застосування. По-друге, кількість API-запитів до великих моделей зросте у кілька разів через розвиток Agentic AI. За 3-5 років, ймовірно, inference займе 70-80% обчислювального навантаження.

Ще одна причина — швидкість ітерацій у тренуванні зменшується. Компанії, що можуть тренувати великі моделі, стають все меншими, і багато компаній зосереджуються на комерціалізації вже існуючих моделей, а не на швидкому створенні нових. Це знижує попит на тренувальні обчислення. Якщо у майбутньому з’являться прориви у сфері фізичного розуму або глобальних моделей, це може змінити ситуацію.

Цей перехід від тренування до inference ставить високі вимоги до чіпів: inference дуже чутливий до вартості, енергоспоживання і затримки, і має враховувати різноманітність сценаріїв — від хмари до кінцевих пристроїв. Це створює можливості для різних архітектур (GPU, ASIC, CPU). Вимоги до пропускної здатності пам’яті і KV Cache стають ще більш критичними, ніж у тренуванні. Ці технічні виклики відкривають нові ринкові можливості для ARM і зберігання даних.

NAS1000,05%
SPYX0,14%
ARM4,91%
SNDK0,51%
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено