Последний выпуск All In Podcast: как ведущие эксперты оценивают Micron, узкие места в хранении, китайские открытые модели и распределенные вычисления


Этот выпуск All In Podcast вышел очень насыщенным, я выделил несколько наиболее интересных тем.

Начну с линии китайских открытых моделей — прогресс оказался быстрее, чем ожидалось.
Zhipu AI выпустила новую открытую модель Frontier-класса GLM 5.2 с 744 миллиардами параметров и контекстом в 100 тысяч токенов, полностью под лицензией MIT. Результаты тестов впечатляют: в бенчмарке по программной инженерии она обошла GPT-5.5 и уступает лучшей модели Anthropic Claude Opus 4.8 менее чем на 1%, но цена API на целых 85% ниже, чем у сопоставимых американских моделей с такой же производительностью.

В выпуске есть интересная деталь о способе, которым китайские команды ускоряют своё развитие: они создают фермы из тысяч смартфонов и iPad, с анонимных аккаунтов задают множество вопросов топовым API американских Frontier-моделей, собирают их логические цепочки рассуждений и используют их для усиленного обучения своих открытых моделей. Это всё равно что использовать подробные решения американских лабораторий, полученные за огромные средства, как шпаргалки, достигая схожей производительности с минимальными затратами.

Сакс высказался довольно резко: он критикует Дарио из Anthropic за то, что тот ранее лоббировал правительство США ввести громоздкие процедуры проверки безопасности. Это самоограничение, по его мнению, лишь замедлило американские темпы. Модель Fable сняли с продажи из-за обвинений во взломе, а утверждение новых моделей OpenAI идёт с трудом. Он оценивает технологическое отставание Китая примерно в 9 месяцев, а в чипах — около 24 месяцев, но при этом вся линейка GLM5 уже обучена на собственных чипах вроде Huawei Ascend. В будущем эти дешёвые и качественные «AI-коробки», оптимизированные под местные чипы, могут быть сброшены на мировой рынок по низким ценам, в то время как США вводят себе различные ограничения, отдавая этот многотриллионный экспортный рынок другим.

По поводу отчёта Micron в выпуске прозвучала точная характеристика: DRAM — это настоящее узкое место во всей волне AI.
Квартальная выручка Micron взлетела вчетверо — с 90 до 420 миллиардов, прогнозы далеко превзошли ожидания, а все мощности HBM на 2026 год уже распроданы.

В выпуске прямо сказали: до этого все искали в Twitter мелкие японские компании, котирующиеся как «акции узких мест», но настоящее узкое место — только DRAM, особенно HBM. Причина проста: пропускная способность и объём памяти определяют физический потолок производительности вывода всех больших моделей — это жёсткое ограничение, которое не обойти. Даже упомянули, что строящийся Маском суперзавод технически ориентирован именно на DRAM, а не на оптоволокно, источники питания или NAND-флеш.

На этот раз Micron также совершил интересное изменение в бизнес-модели: подписал долгосрочные контракты с ключевыми облачными провайдерами с защитой по нижнему и верхнему пределам цен, заблокировав 50% будущей выручки. Это значит, что даже при спаде в отрасли минимальная контрактная цена будет выше пиковой маржи за любой прошлый цикл.

Что касается барьеров входа, хотя китайская CXMT готовится к IPO и в будущем может смягчить ценовое давление для Apple и других крупных производителей за счёт дешёвой низко-среднеуровневой потребительской памяти, в сегменте топового HBM для AI-серверов пока способны производить только три компании: Micron, SK Hynix и Samsung. Технологический процесс крайне сложный, его не догнать в краткосрочной перспективе.

В выпуске дали довольно смелый прогноз: в следующем году от 30% до 40% всех мировых капитальных затрат на гипермасштабирование пойдут напрямую производителям чипов DRAM. Этот рост расходов уже вызвал повышение розничных цен на всю линейку MacBook и Mac Studio от Apple.

Область периферийных вычислений и распределенного вывода — самая воображаемая часть выпуска, поделюсь несколькими интересными идеями.

Tesla 18 июня подала заявку на товарный знак «Megapod». Физическая логика: построить наземный дата-центр мощностью 1 ГВт требует длительных согласований по земле, энергопотреблению и жидкостному охлаждению. Концепция Megapod — интегрировать GPU, аккумуляторную сеть и систему охлаждения в контейнерный модульный дата-центр, который можно разместить прямо на сети суперзарядных станций Tesla с уже утверждёнными разрешениями, готовой электросетью и свободной землёй — обходя самые большие препятствия в строительстве традиционных дата-центров: согласования и подключение электроэнергии.

Логика распределённого вывода тоже интересна: ответ модели можно разделить на два этапа — этап понимания вопроса (Prefill) и этап генерации (Decode), требующий высокой пропускной способности и большого объёма памяти. Крупные игроки могут скупать старые GPU, подключать к ним внешние чипы для оптимизации декодирования, формируя дешёвые распределённые сети вывода.

Ещё более безумная идея — предлагать скидку владельцам домашних аккумуляторов Powerwall при условии встраивания AI-чипов в каждый аккумулятор, в сочетании со спутниковым подключением Starlink. Когда аккумуляторы не используются, они автоматически образуют огромный распределённый P2P-пул вычислений, обеспечивая непрерывный почти бесплатный офшорный хостинг вычислений. Если такая идея когда-нибудь реализуется, это станет серьёзным ударом по традиционным облачным гигантам.

Самая безумная часть — это космические вычисления. Наземный дата-центр на 1 ГВт требует 35 миллиардов долларов на чипы и 25 миллиардов на охлаждение и рабочую силу, плюс бесконечные споры о землепользовании. Но с полной многоразовостью Starship от SpaceX стоимость запуска 1 ГВт вычислительной мощности на орбиту с лазерной связью может упасть до 5 миллиардов долларов. Естественная экстремальная температура космоса и практически неограниченная солнечная энергия могут позволить экономике космических дата-центров превзойти наземные в течение 3–4 лет.
DRAM-4,91%
SKHYNIX-8,97%
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено