Meta продает вычислительные мощности, Palantir ругается, Zhipu становится топом Кремниевой долины — история AI Capex требует иного подхода.

Автор: 涨声 Beatz

Цены на AI снова резко откатились, на этот раз из-за того, что Meta заявила, что может продать свои избыточные вычислительные мощности.

Если бы эта новость появилась три года назад, вряд ли кто-то удивился бы. Облачные вычисления — это по сути бизнес по разрезанию серверов на части и продаже их другим. Amazon, Microsoft и Google занимаются этим много лет. Новые облачные провайдеры, такие как CoreWeave и Nebius, тоже пошли по этому пути, превращая чипы NVIDIA в залоговое обеспечение для финансирования, а затем превращая финансирование в еще больше чипов.

Но когда дело дошло до Meta, ситуация изменилась.

Meta раньше не так понимала вычислительные мощности. Она покупала чипы, строила дата-центры, боролась за электроэнергию и землю — для своих собственных моделей, для рекламной системы, для рекомендательных лент, для того самого «суперинтеллекта», о котором все чаще говорит Цукерберг. Meta — не облачный провайдер. Она не зарабатывает на аренде машин другим.

Компания, которая раньше говорила: «Мне нужно как можно больше машин, потому что будущее их поглотит», теперь говорит: «Если эти машины временно не загружены, их можно продать другим».

Это не обязательно означает избыток вычислительных мощностей, но и не стоит просто игнорировать.

В день обвала рынка акций генеральный директор Palantir Алекс Карп в программе CNBC около двадцати минут ругался прямо в камеру.

Он пришел поговорить о новом партнерстве Palantir и NVIDIA, но быстро переключился на модель оплаты токенов OpenAI и Anthropic. Он сказал, что генеральные директора частно жалуются ему на то, что корпоративное внедрение AI сейчас — это «платить за токены, которые не создают никакой ценности, и отдавать свои данные». Он даже назвал все более дорогие счета за модели налогом на богатство, давящим на компании.

Последние два года все обсуждали, кто готов тратить, кто тратит быстро, кто быстрее всех строит дата-центры. Теперь вопрос постепенно меняется. Машины куплены — кто сможет поддерживать их загрузку на полную мощность?

Заявление Meta еще не оформилось в официальный бизнес. По открытой информации, внутри компании есть направление Meta Compute, которое может продавать сырые вычислительные мощности или, как Amazon Bedrock, предлагать разные модели на своей инфраструктуре разработчикам. Ранее Цукерберг говорил на собрании акционеров, что внешние компании почти каждую неделю спрашивают, могут ли они купить API-сервисы Meta или часть вычислительных мощностей, и готовы платить выше себестоимости Meta.

Тогда он добавил: они еще этого не делают, потому что Meta считает, что сама сможет использовать эти вычислительные мощности.

Если они нужны — аренда это выбор. Если не нужны — аренда это обезболивающее для баланса.

Самое сложное в этой оценке — Meta может просто высвободить временное окно в строительном ритме и продавать временно свободные ресурсы. А может указывать инвесторам, что многомиллиардные расходы на AI нельзя вечно оправдывать далеким суперинтеллектом, нужно сначала найти более близкую линию доходов.

Оба варианта возможны.

Спрос не исчез, просто начал отбирать

Capex — основа нарратива AI, без исключений. Как и в 2021 году с «печатанием денег», ожидание постоянного роста Capex и постоянной эмиссии заставляло расти все ветки рынка. Как только стало известно, что Meta готовится продавать вычислительные мощности, многие подумали: AI capex рухнет. Крупные компании наконец признали, что купили слишком много, и праздник полупроводников закончен.

Так говорить слишком просто.

Открытые данные пока не поддерживают такой однозначный вывод. Выручка AWS в первом квартале выросла на 28%, до 37,6 миллиарда долларов — редкий быстрый рост за последние годы. Google Cloud вырос еще быстрее, до 20 миллиардов долларов. Microsoft Azure также росла на уровне около 40%.

Amazon продолжает заявлять, что капитальные расходы в этом году могут достичь 200 миллиардов долларов, Alphabet поднял прогноз капитальных расходов на 2026 год до 180–190 миллиардов долларов, и Meta сама подняла годовые капитальные расходы до 125–145 миллиардов долларов.

Эти цифры не похожи на коллапс спроса.

Скорее на расслоение.

Положение облачных провайдеров отличается от положения разработчиков моделей. Облачные провайдеры продают дороги. Пока по дороге кто-то едет, неважно, кто сделал автомобиль — они получают деньги. OpenAI, Anthropic, корпоративные клиенты, правительственные клиенты, стартапы — в конечном итоге все они где-то разместятся: на каком-то дата-центре, на каких-то чипах, в какой-то сети и по какому-то контракту на электроэнергию.

Поэтому три крупных облачных провайдера могут продолжать быть сильными.

AWS даже в конце июня подняла цены на один AI-облачный сервис — это сервис предварительного бронирования GPU для клиентов. AWS повысила цену на этот сервис примерно на 20% с июля. В январе он уже поднимал цену примерно на 15%. Это не те действия, которые бывают при слабом спросе.

Когда ресурс редок, продавец повышает цену.

Но разработчикам моделей не всем так комфортно.

Активы разработчиков моделей более требовательны. Вычислительные мощности не приносят доход просто так. Их нужно постоянно заполнять более умными моделями, более частыми пользователями, более дорогими корпоративными рабочими процессами. Только если модель достаточно хороша, пользователи готовы мириться с очередями, лимитами, повышением цен и все более сложными уровнями подписки.

Именно поэтому Anthropic рассматривается рынком как компания другого типа. Она не дешевая, а потому что пользователи готовы доверять ей дорогие задачи. Написание кода, изменение систем, выполнение длинных задач, интеграция в корпоративные рабочие процессы — если эти задачи действительно попадают в производственную среду, расход токенов будет намного больше, чем в болтовне.

У сильных моделей проблема — нехватка машин.

У слабых моделей проблема — машины никому не жалко.

Обе проблемы называются «вычислительные мощности», но это разные вещи.

Линия xAI тоже пахнет тем же. Grok не сформировал четкого корпоративного менталитета, как сильнейшие модели, но часть вычислительных мощностей в системе Маска может быть направлена в Anthropic. Это действие холоднее любых лозунгов. Машины не узнают основателя, они узнают только того, кто может их загрузить на полную.

Отношения Google и Meta также показывают, что все не так просто. В июне появилась информация, что Google ограничил использование Gemini для Meta, потому что объем вычислительных мощностей, который хотела купить Meta, превышал возможности Google, и это даже повлияло на некоторые AI-проекты внутри Meta. Компания с одной стороны рассматривает продажу своих мощностей, а с другой — не может купить достаточные возможности топовых моделей для некоторых задач.

Это не традиционный избыток.

Это дисбаланс. И счета становятся все более заметными.

Облачные провайдеры могут продолжать повышать цены, потому что они продают определенность. Клиентам нужны GPU, которые точно будут доступны в определенный период времени, стабильный дата-центр, инфраструктура, которая не отключается посреди ночи.

Но когда корпоративные клиенты получают вычислительные мощности, проблемы не заканчиваются.

Им еще нужно предъявить этот счет финансовому директору. Финансовый директор не спросит, сколько токенов было использовано. Он спросит, сколько эти токены сэкономили компании, сколько заработали, сколько ошибок предотвратили.

На уровне предприятия токен превращается в электросчетчик

Это возвращает нас к интервью Карпа в начале.

Он назвал многие вещи, которые AI-компании продают предприятиям, перепродажей. За день до выхода в эфир Palantir опубликовал в X заявление из девяти пунктов о так называемом AI-суверенитете, где специально отметил модель tokenmaxxing. Это слово трудно перевести дословно, но смысл не сложен: потребление токенов рассматривается как прогресс, сжигание денег — как использование, а счет — как производительность.

Карп вывел на первый план передовые лаборатории, такие как OpenAI и Anthropic. Его смысл не в том, что предприятиям не следует использовать сильнейшие модели, а в том, что предприятиям не следует передавать свои данные, процессы и бизнес-суждения, а затем платить по все более высоким счетам за объем потребления.

Palantir хочет продать нечто другое. Не универсальный чат-бокс, не единый API, а интеграцию данных, утверждений, разрешений, операционных правил и AI в одну бизнес-систему. Клиенты платят не за «сколько раз использовали AI», а за то, была ли реально улучшена определенная производственная линия, система управления рисками, правительственная задача.

Люди, которые действительно управляют деньгами на предприятиях, уже начали просыпаться.

UBS недавно общался с IT-директорами предприятий, и одно направление ясно: многие предприятия не отказываются от AI, а начинают устанавливать тормоза на траты AI. Около 60% опрошенных компаний сжимают расходы на токены, добавляют защитные барьеры, особенно те, кто уже прошел фазу проб и начал внедрять AI в повседневные процессы.

Это тоже интересный поворот.

Когда AI превращается из игрушки в инструмент, тратить деньги становится сложнее. На этапе игрушки боссы были готовы давать бюджет, потому что все боялись упустить. На этапе инструмента финансовый директор спросит, кому он сэкономил рабочее время, кому увеличил продажи, кому снизил риски.

На этой таблице токен не похож на доход.

Он больше похож на электросчетчик.

Вы, конечно, можете сказать, что быстрый счетчик означает, что завод работает. Вы также можете сказать, что счетчик слишком быстрый, а объем производства не вырос — значит, с машиной что-то не так.

AI agent усилил эту проблему. В исследовании Codex, проведенном OpenAI и несколькими университетами, есть впечатляющие данные. В первой половине 2026 года количество активных пользователей Codex выросло более чем в пять раз; в некоторых внутренних отделах OpenAI объем выходных токенов взлетел: в юридическом отделе медианный месячный объем выходных токенов был в 13 раз выше, чем в ноябре 2025 года, в исследовательском — более чем в 50 раз.

Другое исследование говорит еще жестче: задачи agentic coding могут потреблять в 1000 раз больше токенов, чем обычный чат по коду и рассуждения по коду. Для одной и той же задачи расход токенов между разными запусками может отличаться в 30 раз.

Вот в чем суть сегодняшнего дефицита вычислительных мощностей.

Не в том, что люди немного чаще спросили у чат-бота.

А в том, что программное обеспечение начинает превращаться в группу маленьких работников, которые снова и снова читают файлы, запускают команды, изменяют код, терпят неудачу, начинают заново, снова терпят неудачу, снова начинают. У них нет обеденного перерыва, но каждый шаг они потребляют токены.

Когда токен становится электросчетчиком, тот, кто владеет электростанцией, имеет власть. Но кто тратит электроэнергию впустую, того сначала будут допрашивать.

Как только счет становится толще, дешевые модели находят свое место

Как только финансовый директор начинает смотреть на этот счетчик, следующий шаг почти очевиден.

Он спросит: какие задачи должны использовать сильнейшую модель, а какие — лишь достаточно хорошую.

В этот момент GLM, Kimi, DeepSeek, Qwen и другие открытые модели перестают быть просто техническими новостями. Они становятся инструментом для снижения цен на столе закупок предприятий.

Даже Марк Андриссен из топ-венчурной компании a16z сказал, что многие специалисты по AI уже считают GLM-5.2 от Zhipu первой китайской моделью, способной соответствовать или даже превосходить ведущие американские открытые модели в большинстве задач. Эта оценка не обязательно окончательна, но она дает предприятиям еще один аргумент.

Coinbase дал еще более конкретный пример. Брайан Армстронг сказал, что компания перевела свою стандартную AI-модель на открытые модели, такие как GLM 5.2 и Kimi 2.7, в сочетании с маршрутизацией моделей, кешированием и сокращением контекста. Использование токенов все еще растет экспоненциально, а расходы на AI сократились почти вдвое.

Разрушительная сила этой фразы в том, что предприятия впервые могут разбить возможности модели для закупок.

Самые сложные задачи по-прежнему отдают самым дорогим моделям. Обычные задачи — краткие обзоры, обслуживание клиентов, извлечение информации, шаблонный код, ответы на вопросы по внутренней базе знаний — отдают дешевым моделям и локальным развертываниям.

Открытая модель не обязательно должна выиграть все поле боя.

Она должна лишь убедить отдел закупок, что не каждый киловатт-час нужно оплачивать по тарифу элитного жилья.

Здесь новость о продаже Meta вычислительных мощностей перестает быть изолированной.

Она вместе с критикой Palantir токенов и разделением открытых моделей Coinbase говорит об одном и том же: цепочка расходов на AI начинает разбиваться. Верхний уровень продает определенность, средний — результат, нижний — давит на цену за единицу. Каждый уровень все еще растет, но каждый уровень теперь спрашивают: стоят ли потраченные деньги того.

Самое сложное — не купить машины, а заставить их постоянно работать

Последние два года самой легкой историей в AI была нехватка ресурсов.

Не хватало GPU, электроэнергии, дата-центров, инженеров, даже облаков для запуска моделей. Эта история была слишком простой. Когда чего-то не хватает, все инстинктивно бросаются вперед. Сначала занимают позиции, подписывают контракты на электроэнергию, покупают чипы, ставят машины.

В гонке за ресурсами люди не считают мелкие детали.

Потому что опоздать кажется еще более дорогим.

Но новость Meta выдвинула другой вопрос. Машины куплены — но просто потому, что они дорогие, они не станут автоматически хорошим бизнесом. Им нужно каждый день иметь работу, клиентов, готовых платить, модель, чтобы их нагрузить, приложение, чтобы превратить затраты в доход.

Это и есть коэффициент использования.

Слово «коэффициент использования» звучит холодно, но на самом деле оно жестоко. Оно спрашивает не о вашем будущем, а о том, работала ли ваша машина сегодня. Ему все равно, что вы говорите на презентации, и не важно, купили ли вы самый дорогой GPU. Оно смотрит только на одно: принесли ли эти деньги стабильный денежный поток.

Облачным провайдерам ответить на этот вопрос проще. Они изначально продают инфраструктуру. AWS, Google Cloud, Azure продают дороги, электричество и серверные. Клиенты хотят обучать модели, запускать инференс, размещать приложения — все в итоге уходит на какое-то облако.

Поэтому они могут оставаться сильными.

У сильных разработчиков моделей тоже есть свой ответ. Если модель достаточно сильна, пользователи готовы стоять в очереди, предприятия готовы подключаться, разработчики готовы перестраивать рабочие процессы вокруг нее — тогда вычислительные мощности не склад, а узкое место. Чем больше машин, тем быстрее они могут работать.

Сложнее всего среднему уровню.

У них есть машины, есть истории, есть команды моделей и большие бюджеты. Но модель не вышла в лидеры, продукт не стал повседневной привычкой, разработчики не хотят перестраивать рабочие процессы под него. Для таких компаний вычислительные мощности могут превратиться из оружия в склад всего за одну неудачную версию модели или одно перемещение пользователей.

Склад не обязательно бесполезен.

Но товар со склада нужно уценивать, сдавать в аренду, искать новое применение.

Именно поэтому новость о продаже Meta вычислительных мощностей так заметна. Она не доказывает провал Meta и не исчезновение спроса на AI. Она просто впервые заставляет рынок увидеть, что инфраструктура AI может столкнуться с теми же проблемами, что и обычные заводы.

Завод построен, а заказы где?

Вычислительные мощности не исчезли, они начали расслаиваться

Поэтому лучше всего понимать ситуацию не как «избыток вычислительных мощностей».

Это слово слишком грубое.

Более точное выражение: вычислительные мощности начинают расслаиваться.

На самом верхнем уровне все еще плотно. За самые сильные модели, лучшие облака, самые стабильные кластеры GPU все еще идет борьба. AWS может поднимать цены, потому что сама определенность имеет цену. Клиенты покупают не просто GPU, они покупают гарантию, что в определенный день, в определенный час, определенная партия машин точно будет доступна.

Средний уровень становится неловким. Он может быть неплох, но недостаточно редок. Он может запускать модели, делать инференс, продавать внешним клиентам. Но клиенты будут сравнивать, торговаться, спрашивать, почему не использовать более дешевую модель, почему не взять чужое облако, почему эта партия машин стоит именно столько.

Самый нижний уровень будет постепенно сжиматься под давлением открытых моделей и оптимизации затрат. Предприятия не будут вечно вызывать самую дорогую модель для обычных задач. Они будут делать маршрутизацию, кеширование, сжимать контекст, разбивать модели на разные уровни.

Спрос вырос.

Дети не смотрят на счета, взрослые смотрят. Когда AI входит в предприятия, он проходит тот же процесс. На этапе пилота все боятся упустить; на этапе масштабирования все начинают считать.

После подсчетов цепочка уже не будет такой однородной, как на раннем этапе.

Кто-то продолжит повышать цены, потому что продает незаменимую определенность. Кто-то перейдет на продажу результатов, потому что клиенты не хотят платить за само потребление. Кто-то будет вынужден снижать цены, потому что появились достаточно хорошие альтернативы. Кто-то сдаст машины в аренду, потому что простаивающие машины выглядят хуже, чем дешевая аренда.

Эти вещи происходят одновременно, делая отрасль противоречивой.

С одной стороны — дефицит вычислительных мощностей.

С другой — аренда вычислительных мощностей.

С одной стороны — взрывной рост потребления токенов.

С другой — предприятия снижают расходы на AI.

С одной стороны — топовые модели становятся все сильнее.

С другой — открытые модели становятся все дешевле.

Они не противоречат друг другу. Они лишь показывают, что AI перешел от истории об общем объеме к истории о структуре.

История старых железных дорог повторится

Во время железнодорожного пузыря XIX века железные дороги не были фальшивыми.

Рельсы прокладывали, грузы действительно шли, города росли, время сокращалось. Многие из самых ценных коммерческих сетей впоследствии действительно выросли рядом с этими рельсами.

Но это не помешало многим тогдашним строителям железных дорог терять деньги.

Они проиграли не в направлении. Они проиграли в том, что построили слишком рано, слишком много, в местах без грузового и пассажирского потока, или взяли слишком дорогие кредиты для строительства дороги, которая окупалась слишком медленно.

Волоконно-оптические линии в пузыре доткомов тоже. Волокно не было ошибкой. Весь мир потом на нем поднялся. Ошибка была в бухгалтерских книгах, которые засунули спрос на десятилетия вперед в несколько лет капитальных расходов.

AI-дата-центры, возможно, тоже оставят много полезного. GPU будут амортизироваться, контракты на электроэнергию будут продлеваться, дата-центры будут обновлять оборудование, программное обеспечение будет все лучше потреблять вычислительные мощности. Сегодняшнее шокирующее потребление токенов через несколько лет может стать таким же обычным, как трафик HD-видео.

Но у активов есть свой характер.

Им все равно, верите ли вы в будущее. Их волнует только то, приходят ли люди использовать их каждый день.

Сигнал Meta о продаже вычислительных мощностей застрял именно в этом месте.

Это не конец AI. И не конец полупроводников. Это скорее момент, когда история капитальных расходов достигает середины, и кто-то впервые открывает дверь, чтобы снаружи увидели, сколько машин на складе.

Некоторые машины будут поглощены топовыми моделями.

Некоторые машины арендуют облачные клиенты.

Некоторые машины подешевеют в ценовой войне.

А некоторые машины будут тихо ждать приложения, которое еще не появилось.

Последние два года рынок был готов верить, что все машины в итоге найдут свою судьбу. Теперь он начинает спрашивать: кто найдет первым, кто не найдет, кто найдет, но не заработает достаточно денег.

Как только этот вопрос возникает, история AI меняется.

Она больше не принадлежит только тем, кто быстрее всех покупает машины.

Она принадлежит тем, кто сможет заставить машины крутиться постоянно.

Оригинальная ссылка

Нажмите, чтобы узнать о вакансиях BlockBeats

Добро пожаловать в официальное сообщество BlockBeats:

Telegram-канал подписки: https://t.me/theblockbeats

Telegram-чат общения: https://t.me/BlockBeats_App

Официальный Twitter: https://twitter.com/BlockBeatsAsia

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено