OpenClaw позволил компаниям, создающим модели, впервые почувствовать вкус экономики токенов.


17 июня открыт исходный код GLM-5.2. На этот раз всё по-другому.
Лицензия MIT: свободно изменяйте, свободно продавайте, единственное обязательство — сохранять авторское право.
Риски, связанные с интеллектуальной собственностью, сводятся к нулю, компании могут спокойно внедрять модели в свои коммерческие продукты, изменять их и не отдавать обратно. В отличие от вирусных лицензий типа GPL, которые требуют открывать исходный код при использовании, MIT снимает эти барьеры.
Более того — все модели с этого момента входят в эпоху долгого рассуждения.
Что именно изменилось в GLM-5.2?
В эпоху OpenClaw агент работает в режиме "спринта" — каждый задачный цикл ограничен, планирование — выполнение — завершение, масштаб KV-кэша управляем, нагрузка на оборудование — в основном вычислительная.
Долгосрочное рассуждение GLM-5.2 — это "марафон" — 1 миллион токенов без потери контекста, модель может в рамках одной задачи держать весь код, всю историю решений, все ограничения. В реальных тестах один раз обработано 880 тысяч токенов, почти полностью заполнив окно.
Что это значит?
Ранее ИИ работал в режиме "один вопрос — один ответ", расход токенов завершался после одного цикла.
После GLM-5.2 агент начинает выполнять настоящие долгосрочные задачи: разбиение цели → многократное планирование → многократная проверка → настройка инструментов → написание кода и запуск его → переработка плана на основе обратной связи. Один цикл задачи может запускать сотни рассуждений.
Каждый цикл требует загрузки полного контекста в память и повторных вычислений.
Постоянные вычисления, постоянная коммуникация, постоянное чтение и запись.
Эти три "постоянных" полностью меняют логику ценообразования аппаратного обеспечения.
Что выгодно для долгосрочного агентского рассуждения?
🥇 HBM
KV-кэш растет линейно с количеством раундов диалога и длиной контекста, быстро исчерпывая объем GPU HBM. Как только KV-кэш покидает локальную память GPU, пропускная способность снижается с терабит в секунду до сотен гигабит в секунду — проблема переходит от "вычислительной мощности" к "пропускной способности памяти".
Три крупнейших производителя не справляются с объемами, дефицит составляет 50-60%, к 2026 году рынок достигнет 54,6 миллиарда долларов.
🥈 Оптические чипы/InP
Долгосрочное рассуждение выполняется в кластерах, каждый цикл требует синхронизации между узлами. Чем длиннее задача и чем больше циклов, тем больше объем передачи данных.
Рынок оптических модулей к 2026 году — 26 миллиардов долларов, ежегодный рост 60%.
Дефицит подложек InP превышает 70%, цена индия выросла на 90% по сравнению с прошлым годом.
🥉 CPU
Долгосрочные задачи требуют постоянного разбиения, вызова инструментов, управления процессами, планирования KV-кэша. Эти задачи плохо выполняются на GPU, их должен выполнять CPU.
Соотношение CPU и GPU приближается к 1:1, генеральный директор Intel публично заявил, что "многим компаниям звонят руководители, требуя ускорить поставки CPU".
❄️ Жидкостное охлаждение
Краткое рассуждение — импульсная нагрузка, долгосрочное — постоянная полная нагрузка. На одной и той же карте, энергопотребление при долгосрочных задачах в 3-5 раз выше, чем при коротких.
Энергопотребление в стойке выросло с 36 кВт до 200 кВт, воздушное охлаждение не справляется, жидкостное охлаждение становится обязательным.
🔌 Коммутатор
Требования к пропускной способности кластеров рассуждения выросли с 100G до 400G, сотни тысяч карт требуют управления.
Инфраструктура InfiniBand и высокоскоростной Ethernet полностью выигрывают.
📦 Плата ABF
Кластеры расширяются с тысяч карт до десятков тысяч, каждая чиповая плата должна быть запаяна.
Компания Morinaga доминирует с более чем 90% рынка мембран ABF, к 2028 году дефицит составит 42%.
Цены на муку растут, хлеб станет еще дороже.
🧪 CCL M9
Материнские платы и задние платы для кластеров рассуждения требуют высокоскоростных базовых материалов.
Цена M9 в 10 раз выше обычного FR4, рынок AI CCL к 2027 году достигнет 18,7 миллиардов долларов, рост превысит рынок оптических модулей.
OpenClaw зажег огонь, GLM-5.2 — дрова.
Первое позволило моделям заработать первую порцию токенов, второе — вывело этот рынок из лаборатории в промышленность.
Простые операции все еще остаются в памяти, в свете, наслаждаясь пузырем AI.
$MU $SKHYNIX $LITE
TOKEN2,17%
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено