17 червня відкрито GLM-5.2. Цього разу все інакше.
Ліцензія MIT: будь ласка, змінюйте, продавайте, єдина умова — зберігайте авторське право.
Ризики щодо інтелектуальної власності зведені до нуля, компанії можуть безпечно інтегрувати моделі у свої комерційні продукти, змінювати їх і не зобов’язані видавати.
На відміну від GPL, який "змушує відкривати код при використанні", ліцензія MIT знімає цю планку.
Ще важливіше — всі моделі тепер входять у еру довгого розуміння.
Що саме змінилося в GLM-5.2?
У епоху OpenClaw агент виконує "спринт" — кожне завдання має обмежений час, планування — виконання — завершення, масштаб KV Cache контрольований, навантаження на апаратне забезпечення — головним чином обчислювальна потужність.
Довгий розумовий процес у GLM-5.2 — це "марафон" — 1М беззбитковий контекст, модель може одночасно тримати весь код, всю історію рішень, всі обмеження у одному завданні.
У реальних тестах оброблялося 880 тисяч токенів за один раз, майже заповнюючи весь вікно.
Що це означає?
Раніше ШІ працював у режимі "один запит — один відповідь", токени витрачалися один раз.
Після GLM-5.2 агент починає справжній довгий процес: розбиття цілі → багатократне планування → багаторазова перевірка → налаштування інструментів → написання коду та його запуск → переспланування на основі зворотного зв’язку.
Одна задача може викликати сотні циклів розуміння.
Кожен цикл вимагає завантаження повного контексту у пам’ять для повторних обчислень.
Безперервні обчислення, безперервна комунікація, безперервне читання та запис.
Ці три "безперервні" принципи кардинально змінили логіку ціноутворення апаратного забезпечення.
Що виграє довгий агентський процес?
🥇 HBM
KV Cache зростає лінійно з кількістю раундів діалогу та довжиною контексту, швидко вичерпуючи об’єм GPU HBM.
Якщо KV Cache виходить за межі локальної пам’яті GPU, пропускна здатність знижується з терабайт/с до сотень гігабіт/с — проблема переходить від "обчислювальної потужності" до "пропускної здатності пам’яті".
Три великі виробники не справляються з попитом, дефіцит 50-60%, до 2026 року ринок оцінюється у 54,6 мільярда доларів.
🥈 Оптичні чіпи/InP
Довгий розумовий процес виконується у кластері, кожен цикл потребує синхронізації між вузлами.
Чим довше завдання, чим більше циклів, тим більше обсяг передачі даних.
Оптичні модулі у 2026 році — 26 мільярдів доларів, з річним зростанням 60%.
Дефіцит підкладок InP понад 70%, ціна індію зросла на 90% у порівнянні з минулим роком.
🥉 CPU
Довгі завдання вимагають постійного розбиття, викликів інструментів, управління процесами, планування KV Cache.
Ці задачі погано виконуються на GPU, їх краще делегувати CPU.
Співвідношення CPU та GPU зменшується з 1:8 до майже 1:1, генеральний директор Intel відкрито заявив, що "багато компаній телефонують, щоб прискорити поставки CPU".
❄️ Жидкостне охолодження
Короткий розумовий процес — імпульсний навантаження, довгий — постійне навантаження.
На одній карті довгий процес споживає у 3-5 разів більше енергії, ніж короткий.
Споживання у шафі зросло з 36 кВт до 200 кВт, вентильне охолодження не справляється, рідинне охолодження стає обов’язковим.
🔌 Комутатор
Пропускна здатність кластеру для розуміння зросла з 100G до 400G, потрібно керувати сотнями тисяч карт.
Інфра- та високошвидкісні Ethernet — у виграші.
📦 Плата ABF
Кластер з тисячами карт розширюється до десятків тисяч, кожна чіп — у корпусі.
Монополія компанії Mitsui на 90%+ ABF-міст, дефіцит у 2028 році — 42%.
Це призводить до подорожчання хліба, і хліб стане ще дорожчим.
🧪 CCL M9
Материнські плати та задні панелі для кластерів розуміння — всі мають високошвидкісні підкладки.
Ціна M9 у 10 разів вища за звичайний FR4, у 2027 році ринок AI CCL — 18,7 мільярда доларів, зростання швидше за оптичні модулі.
OpenClaw запалив вогонь, GLM-5.2 — дрова.
Перший дозволив моделям заробити перший токен, другий — вивів цей ринок із лабораторії у промисловість.
Прості операції все ще базуються на збереженні, світлі, і насолоджуються AI-бульбашкою.
$MU $SKHYNIX $LITE

TOKEN3,03%

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

Нагородити
подобається
Прокоментувати
Репост
Поділіться

Прокоментувати

Додати коментар

Немає коментарів

Популярні теми
Дізнатися більше
#
gStocksTokenizedStocksLive
4,5M Популярність
#
StrongNonfarmPayrollsRekindleRateHikeFear
1,04M Популярність
#
IsraelStrikesIranBTCPlunges
67,91K Популярність
#
PredictWorldCupShare20000U
143,31K Популярність
#
ETHBreaks1700
152,55M Популярність

Закріплено

карта сайту

OpenClaw вперше дозволила компаніям, що займаються моделями, відчути солодкий смак токенової економіки.

Популярні теми

gStocksTokenizedStocksLive

StrongNonfarmPayrollsRekindleRateHikeFear

IsraelStrikesIranBTCPlunges

PredictWorldCupShare20000U

ETHBreaks1700

Закріплено