ШІ одночасно спричинив дефіцит і надлишок пам’яті

robot
Генерація анотацій у процесі

29 березня, Силіконна долина Б? (Хуацянбэй) і американський ринок роздрібної торгівлі синхронно пережили обвальне падіння цін на модулі пам’яті. Комплекти Corsair 32GB DDR5-6400 знизилися з 490 доларів до 380 доларів, денне падіння становило 22%. В Україні (внутрішньому ринку) 32GB DDR5 високочастотні комплекти за тиждень обвалилися на 800 юанів, дистриб’ютори в паніці почали продавати з запасів, а один із дилерів сказав: «За один день впало більше ніж на сто з чимось».

Але якщо цей показник накласти на довшу часову шкалу, картина зовсім інша: навіть після падіння поточні ціни на DDR5 все ще у чотири рази вищі, ніж у липні 2025 року. Це був один точний випадок невідповідності попиту й пропозиції в ланцюгу постачання AI: та сама сила спочатку створила дефіцит, а потім — паніку через надлишок.

Карусель: за вісім місяців +540%, за місяць -22%

У липні 2025 року комплект звичної місткості 32GB DDR5-6000 на американському роздрібному ринку коштував лише 77 доларів. До січня 2026 року ціна того самого комплекту злетіла до 490 доларів. За вісім місяців — зростання на 540%.

Підвищення цін не сталося тому, що споживачі раптом божевільно почали масово оновлювати комп’ютери. Згідно з даними TrendForce, у 1-му кварталі 2026 року ціни на DRAM-контракти відносно попереднього кварталу зросли на 90%-95%, з них приріст PC DRAM перевищив 100% і став найбільшим квартальним зростанням за весь час. Усе це спричинила «потреба» в певному типі пам’яті, яку спричинило будівництво AI-інфраструктури.

А потім, 25 березня, Google опублікувала алгоритм стиснення під назвою TurboQuant. Через чотири дні ціни на пам’ять обвалилися.

Куди поділася потужність? HBM «з’їла» ваші модулі пам’яті

Щоб зрозуміти це підвищення цін, потрібно спершу зрозуміти один ключовий технічний параметр. HBM (high bandwidth memory — пам’ять з високою пропускною здатністю, спеціалізована пам’ять для AI-чипів NVIDIA) споживає втричі більше площі кремнієвої пластини на 1 ГБ, ніж звичайний DDR5. За повідомленням Tom’s Hardware, це означає, що з тієї самої пластини можна виготовити лише одну третину обсягу DDR5, якщо робити HBM.

Samsung, SK hynix і Micron — три провідні виробники пам’яті — раціонально обрали, врахувавши високу маржинальність HBM: вони спрямували до 40% потужностей із передових техпроцесів на виробництво HBM. Згідно з даними TrendForce, у 1-му кварталі 2026 року маржа прибутку DDR5, як очікується, вперше перевищить HBM3e — це відображає, наскільки сильним було «виштовхування» забезпечення споживчої пам’яті з ринку.

Найрадикальніший вибір зробила Micron. У грудні 2025 року ця компанія оголосила про закриття споживчого бренду Crucial, який працював 29 років, і повністю вийшла з ринку споживчої пам’яті та накопичувачів, повністю переключившись на корпоративних клієнтів і клієнтів AI. Згідно з повідомленням про відносини з інвесторами Micron, у 2025 фінансовому році її загальний виторг становив 37,38 мільярда доларів, і датацентри та AI-додатки вже становили 56% від загального виторгу. Споживчий ринок — більше не варто було цим займатися.

Потужності SK hynix для HBM уже повністю розкуплені щонайменше до кінця 2026 року. Samsung планує до кінця 2026 року збільшити місячні потужності HBM з 170 тисяч пластин до 250 тисяч. Нові фабрики пластин (Samsung P4L і SK hynix M15X) зможуть вийти на масове виробництво найраніше у 2027-2028 роках. Іншими словами, дефіцит пропозиції споживчого DRAM є структурним, а не таким, який можна швидко зняти за один-два квартали.

Обернення розкладу: SK hynix ламає гегемонію Samsung, що трималася 40 років

Це перенесення потужностей також переписало карту влади в індустрії пам’яті. Згідно з даними TrendForce, у 2-му кварталі 2025 року SK hynix завдяки глибокій прив’язці до NVIDIA отримала 62% частки ринку HBM, тоді як Samsung мала лише 17%, а Micron — 21%.

Ще важливішим є переворот на рівні виручки. Згідно зі звітом TrendForce за Q3 2025, SK hynix уперше очолила за квартальною виручкою DRAM з 13,75 мільярда доларів, а Samsung одразу ж слідувала за нею з 13,50 мільярда доларів. Різниця між ними — лише 250 мільйонів доларів, але це вперше за останні близько 40 років, коли Samsung втратила перше місце за виручкою від пам’яті. За повідомленням CNBC, операційний прибуток SK hynix за весь 2025 рік також уперше перевищив прибуток Samsung.

Першочергова перевага HBM дала SK hynix достатньо «озброєння», але ця гонка ще далеко не завершена. Samsung у повному обсязі наздоганяє графік масового виробництва HBM4, а Micron, хоча й відмовилася від споживчого ринку, наростила темпи зростання виручки в корпоративному та AI-сегменті (Q3 до Q2: +53,2%) — найшвидші серед трьох виробників.

Як один алгоритм похитнув логіку зростання цін?

25 березня Google представила на ICLR 2026 алгоритм TurboQuant. Цей алгоритм зробив одну річ: стиснув KV-кеш (key-value cache — кеш ключ-значення, найбільша за споживанням пам’яті частина під час виведення/інференсу великої мовної моделі) з точності FP16 до 3-bit, зменшивши використання пам’яті щонайменше в 6 разів, а також досягнувши до 8 разів прискорення обчислень уваги на GPU H100. За даними блогу досліджень Google, у п’яти тестах на довгий контекст, зокрема Needle-in-a-Haystack, втрати точності дорівнюють нулю.

Ринок швидко порахував. Якщо TurboQuant або подібні алгоритми широко застосовуватимуть основні AI-компанії, то додатковий попит AI-інференсу на DRAM істотно скоротиться. І саме ключова наративна причина, яка підтримувала зростання цін на пам’ять останні пів року, полягала в тому, що «AI-інфраструктура споживає надто багато потужностей пам’яті».

Через чотири дні — віра каналів зруйнувалася.

Важливо зазначити: TurboQuant орієнтований на KV-кеш у кінці AI-інференсу, а не на потребу HBM на етапі тренування. Взаємовідносини попиту й пропозиції для HBM у короткостроковій перспективі не зміняться через один оптимізаційний алгоритм для інференсу. Але ринок не завжди відрізняє ці речі. За повідомленням Sina Finance, на початку періоду до обвалу через зростання цін внутрішні канали в Україні/Китаї (domestic channels) масово напливали тими, хто запасався «поза периметром», а високі ціни призвели до падіння роздрібних продажів понад 60%; ланцюгова вимушена пролонгація/продажі з дефіцитом грошей під напругою ліквідності в подальшому підсилили масштаб падіння.

Одна й та сама AI-індустріальна ланка одночасно створила і дефіцит пам’яті, і паніку через надлишок. Фізичні потужності HBM «тиснули» й звужували пропозицію споживчої пам’яті — виникла нестача; прорив в ефективності алгоритму TurboQuant знизив очікування щодо потреб AI в пам’яті. Те, що створює зростання цін, і те, що спричиняє крах, — це одна й та сама сила.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити