Пузырь, вызванный NVIDIA, почти лопнул.

Источник: AGI интерфейс

В середине мая, в 90-дневный период приостановки тарифов, разразилась борьба за ключевые ресурсы вычислительной мощности.

"Цены на серверы сильно колеблются, в последнее время цена на каждую единицу выросла на 15%-20%. С приостановкой тарифов мы планируем восстановить продажу по исходной цене." — сообщил поставщик чипов из южного региона журналу Huxiu.

В то же время со стороны предложения на рынке также появляются новые переменные. Тайгер Снифф эксклюзивно узнал, что серия высококлассных продуктов Nvidia Hooper и серия Blackwell незаметно появились на внутреннем рынке, первая появится в сентябре 2024 года, а вторая произошла совсем недавно. Один из руководителей Sinovel сказал: «У разных поставщиков разные источники товаров. «Сложная сеть цепочек поставок, стоящая за этим, нигде не проявляется.

(Примечание Tiger Sniff: С 17 октября 2023 года Вашингтон поэтапно приостановил продажу чипов Nvidia в Китай, включая A100, A800, H800, H100, H200; недавно последняя модель серии Hooper, которая может продаваться в Китай, H20 также была включена в список ограничений на экспорт)

Среди них, серия высококлассных продуктов Hooper от Nvidia обычно относится к H200, который является улучшенной версией чипа H100. Первый стоит всего на несколько сотен тысяч дороже второго, но его эффективность на 30% выше. Серия Blackwell также относится к высококлассным продуктам Nvidia, среди которых B200 стоит более 3 миллионов и является самым «ограниченным в обращении» продуктом на данный момент, с более скрытыми путями обращения. Оба этих устройства используются для предварительной тренировки больших моделей, а B200 особенно «трудно достать».

Вернувшись в апрель 2024 года, в Twitter распространилась фотография, на которой запечатлены генеральный директор NVIDIA Дженсен Хуанг, Сэм Альтман и соучредитель OpenAI Грег Брокман. Эта фотография связана с ключевым этапом поставки первой партии продукта H200 — Дженсен Хуанг лично доставил его, а OpenAI стал одним из первых пользователей H200.

Всего через 5 месяцев из-за океана пришли новости о поставках H200. В настоящее время в стране уже есть поставщики, способные обеспечивать поставку 100 серверов H200 в неделю. По словам этого поставщика, с прекращением производства H100 спрос на рынке стремительно переходит к H200, в настоящее время поставщиков, обладающих запасами H200, не более десяти, что еще больше увеличивает разрыв между предложением и спросом.

"Сейчас на рынке не хватает H200, и, насколько я знаю, одна облачная компания в последнее время ищет H200 повсюду." Сообщил игрок с 18-летним стажем в индустрии вычислительных мощностей, который долгосрочно предоставляет услуги вычислительных мощностей компаниям Baidu, Alibaba, Tencent и ByteDance.

В этой гонке вооружений вычислительных мощностей цепочка транзакций окутана тайной. По данным ведущего отечественного поставщика вычислительных мощностей, преобладающее в отрасли правило ценообразования вычислительных мощностей заключается в том, что в контракте указывается только единица вычислительной мощности «P», что преобразует транзакцию сервера в транзакцию с абстрактной вычислительной мощностью. Например, когда пользователь вычислительной мощности и поставщик вычислительной мощности проводят транзакцию вычислительной мощности, модель карты не будет напрямую прописана в контракте, но вычислительная мощность того, сколько P будет использовано вместо нее, то есть конкретная модель карты не будет записана в светлую сторону.

Глубокое погружение в нижний уровень промышленной цепочки выявляет скрытые торговые сети. Ранее некоторые СМИ сообщали, что часть китайских дистрибьюторов через специальные каналы закупок, с помощью многослойной перепродажи и упаковки, реализует серверы «кривым способом». По дальнейшей информации от Hu Xiu, некоторые дистрибьюторы также находят альтернативные пути, используя третьи компании, чтобы получить серверы, внедряя модули в продукцию.

За кулисами бурного промышленного процесса развитие отечественной индустрии вычислительных мощностей также начинает проявлять новые тенденции.

Откуда берется пузырь умных вычислений?

В конце 2023 года «запрет NVIDIA», пришедший с другого конца океана, подобно огромному камню, брошенному в спокойное озеро, запустил тайную войну вокруг основных ресурсов вычислительной мощности.

В первые несколько месяцев рынок проявлял собой первобытный хаос и бурление. Под соблазном огромной прибыли некоторые проницательные индивидуумы начали рисковать. "На тот момент рынок был заполнен 'поставщиками' с различным фоном, среди них были студенты, вернувшиеся из-за границы, а также некоторые осведомленные индивидуумы", - вспоминает анонимный участник отрасли, - "их схема оборота была относительно простой и грубой, хотя сделки все еще оставались скрытыми, но еще не сформировалась та сложная цепочка, которая появилась позже с множественными подрядчиками."

Эти ранние "первопроходцы" использовали информационный разрыв и различные неформальные каналы для того, чтобы передать высококлассные видеокарты Nvidia на рынок. В результате цена на видеокарты, естественно, возросла. По данным некоторых СМИ, среди них некоторые частные поставщики даже устанавливали цену на видеокарту Nvidia A100 на уровне 128000 юаней, что значительно превышает ее официальную рекомендованную розничную цену в примерно 10000 долларов США. Более того, кто-то на платформе социальных медиа держал чип H100 и утверждал, что его цена достигает 250000 юаней. В то время можно сказать, что эти действия и позиции были почти хвастливыми.

Под таким скрытым обращением некоторые крупные поставщики вычислительных мощностей уже начали иметь аналогичные каналы торговой сети, и в то же время возникла волна интереса к интеллектуальным вычислениям. В период с 2022 по 2024 годы в разных местах активно строятся центры интеллектуальных вычислений. По данным, только в 2024 году количество проектов центров интеллектуальных вычислений превысило 458.

Однако этот энергичный «бум карточных спекуляций и интеллектуальных вычислений» длился недолго. К концу 2024 года, особенно после появления отечественных крупных моделей, таких как DeepSeek с их высокой стоимостью, некоторым поставщикам вычислительных мощностей, которые просто полагаются на «накопление Kajuqi» или не имеют поддержки основных технологий, будет все труднее рассказывать свои истории. Пузырь интеллектуальных вычислений также постепенно демонстрирует признаки схлопывания.

Согласно статистическим данным, в первом квартале 2025 года на территории материкового Китая появилось 165 новых проектов по интеллектуальным вычислениям, из которых целых 58% (95 проектов) все еще находятся на стадии одобрения или подготовки, еще 33% (54 проекта) находятся на стадии строительства или готовы к запуску, а на самом деле запущены или находятся в испытательной эксплуатации только 16 проектов, что составляет менее 10%.

Конечно, признаки разрыва пузыря наблюдаются не только в стране. В последние полгода такие компании, как Meta и Microsoft, сообщили о приостановке некоторых глобальных проектов в области дата-центров. Другой стороной пузыря являются беспокойные низкая эффективность и простаивание.

Некоторые специалисты отрасли сообщили Hu Xiu, что "в настоящее время уровень включения интеллектуальных вычислительных центров составляет менее 50%, а отечественные чипы из-за недостатков в производительности не могут быть использованы для предварительного обучения. Более того, некоторые интеллектуальные вычислительные центры используют относительно устаревшие серверы."

Это явление "карта не используется" специалисты в отрасли объясняют как "структурное несоответствие" — это не абсолютный избыток вычислительной мощности, а недостаток эффективного предложения вычислительной мощности, способного удовлетворить высокий спрос, в то время как большое количество уже построенных вычислительных ресурсов не может быть полностью использовано из-за технологического отставания, незавершенной экосистемы или недостаточной операционной способности.

Однако на фоне шумного и тревожного мира интеллектуальных вычислений технологические гиганты демонстрируют совершенно разные подходы.

По сообщениям, ByteDance планирует инвестировать более 12,3 миллиарда долларов (примерно 89,2 миллиарда юаней) в инфраструктуру ИИ в 2025 году, из которых 40 миллиардов юаней будет выделено на закупку ИИ-микросхем в Китае, а еще около 50 миллиардов юаней планируется потратить на покупку микросхем Nvidia. В ответ на это ByteDance заявила, что информация неточная.

Тоже в области ИИ активно инвестирует Alibaba. Генеральный директор У Ёмин 24 февраля публично объявил, что в течение следующих трех лет Alibaba планирует вложить 380 миллиардов юаней в строительство ИИ-инфраструктуры. Эта цифра даже превышает сумму за последние десять лет.

Но сталкиваясь с крупными закупками, давление на сторону предложения также становится очевидным. "Поставки на рынке не успевают обеспечить большие компании, многие компании подписали контракты, но не могут выполнить поставки," - сказал сотрудник по продажам одного из поставщиков интеллектуальных вычислений изданию Huxiu.

В контексте сравнения, упомянутый выше пузырь интеллектуальных вычислений резко контрастирует с нынешними масштабными инвестициями крупных компаний в инфраструктуру ИИ: с одной стороны, поставщики вычислительных мощностей, возглавляемые акциями A, массово приостанавливают крупные проекты интеллектуальных вычислений, с другой стороны, крупные компании активно вкладываются в инфраструктуру ИИ.

Причины этого не так уж сложно понять. Поскольку момент резкого охлаждения интеллектуальных вычислений совпал с DeepSeek. С начала этого года никто больше не поднимал концепцию «сражения ста моделей», DeepSeek разрушил пузырь потребности в обучении. Теперь за столом остались только крупные компании и отдельные компании, занимающиеся AI моделями.

На это управляющий партнер Changlei Capital Фэн Бо также сказал в интервью Hu Xiu: "Когда обучение не разнообразно, то действительно способные и квалифицированные люди продолжат покупать карты для обучения, например, Alibaba и ByteDance, в то время как те, кто не способен заниматься обучением, уйдут, и вычислительная мощность этих людей станет пузырем."

02 Возврат арендованной вычислительной мощности

Любое рождение "пузыря" коренится в иррациональном представлении человека о дефиците. Люди, спекулирующие на Маутае и накапливающие вычислительную мощность, сами по себе не являются любителями Маутая или потребителями вычислительной мощности, а объединены общей спекулятивной психологией.

К концу 2024 года и в первом квартале 2025 года компании, такие как Feilixin, Lianhua Holding, Jinji Co., и другие, снова прекратили контракты на аренду вычислительной мощности на сумму несколько миллиардов юаней. В то же время один из поставщиков вычислительной мощности сообщил Hu Xiu, что "в бизнесе аренды вычислительной мощности возврат аренды - это обычное дело."

Эти компании, прекратившие аренду, не являются истинными конечными пользователями вычислительной мощности. С учетом потрясений в отрасли, вызванных DeepSeek, пузырь в AI-индустрии постепенно лопается, и множество поставщиков вычислительной мощности вынуждены сталкиваться с проблемой избытка мощности, разыскивая стабильные источники клиентов и исследуя новые пути потребления вычислительной мощности.

В ходе расследования Tiger Sniff обнаружил, что на визитной карточке основателя одного из поставщиков вычислительных мощностей, помимо трех компаний в области интеллектуальных вычислений и облачных технологий, также была указана инвестиционная компания. Дальнейшее расследование показало, что проекты, в которые инвестировала эта компания, включают робототехническую компанию и компанию, сосредоточенную на разработке больших моделей и облачных систем. Этот основатель сообщил Tiger Sniff: «Все потребности в вычислительных мощностях этих двух компаний, в которые мы инвестировали, полностью удовлетворяются нашей собственной системой поставки вычислительных мощностей; кроме того, компании, в которые мы инвестируем, обычно покупают вычислительные мощности, поставляемые нами, по рыночной низкой цене."

На самом деле, в индустрии умных вычислений форма, связанная с умными вычислениями + инвестициями, вовсе не является исключением. Для многих поставщиков вычислительных мощностей "это отличный способ использования карт потребления на данный момент, просто это не было выставлено на поверхность". Фэн Бо сказал об этом Ху Сю.

Однако в приведенной выше истории это путь потребления вычислительной мощности в «монопольном» стиле, то есть поставщики вычислительной мощности инвестируют для обеспечения потребностей в вычислительной мощности и напрямую удовлетворяют все потребности в вычислительной мощности финансируемых проектов. Но это не единственный способ.

Фэн Бо считает, что есть еще одна модель: "поставщики вычислительной мощности, выступающие в роли LP, создают модель замкнутой цепочки спроса на вычислительную мощность, которая заслуживает внимания."

В частности, данная бизнес-модель демонстрирует характеристики капитальной взаимосвязи: поставщик вычислительных мощностей A, выступающий в качестве потенциального ограниченного партнера (LP), достигает соглашения о сотрудничестве с инвестиционным фондом B. В инвестиционном портфеле фонда B поставщик приложений ИИ C является целевой компанией, и его бизнес-развитие предъявляет жесткие требования к ресурсам вычислительных мощностей. В этот момент A через стратегические инвестиции в фонд B косвенно связывает будущие потребности компании C в закупке вычислительных мощностей, создавая замкнутый цикл "вложения капитала - закупка вычислительных мощностей".

Если сделка состоится, компания A получит приоритетное право на обслуживание благодаря статусу LP и станет предпочтительным поставщиком для закупки вычислительных мощностей компанией C. Эта модель по сути формирует циклическое движение капитала — инвестиции компании A в фонд B в конечном итоге возвращаются через закупку вычислительных мощностей компанией C.

!

“Это не основной способ, но это довольно удобный способ.” — признал Фэн Бо.

03 Пузырь вот-вот лопнет, и что дальше?

“Говоря о пузыре интеллектуальных вычислений, нельзя говорить только о вычислительной мощности, это проблема цепочки поставок. Чтобы сделать вычислительную мощность полезной, необходимо соединить разорванные точки, в настоящее время эта цепочка поставок еще не образует замкнутый цикл.” Главный маркетинговый директор поставщика вычислительной мощности, работающий в отрасли много лет, точно указал на главную проблему текущей индустрии интеллектуальных вычислений.

В первой половине 2025 года одним из заметных трендов в области ИИ является то, что слово "предобучение", которое раньше часто упоминали крупные компании в области ИИ, постепенно уступает место "выводу". Независимо от того, идет ли речь о широком потребительском рынке B2C или о корпоративных приложениях B2B, кривая роста спроса на вывод выглядит особенно крутой.

"Не мешало бы сделать простую экстраполяцию," оценил один из отраслевых аналитиков, "исходя из объема основных AI-приложений на текущем рынке, таких как Doubao, DeepSeek и другие, предположим, что каждый активный пользователь генерирует в среднем 10 изображений в день; потребность в вычислительной мощности, связанная с этим, может легко достичь уровня в миллион P. Это всего лишь единичный сценарий генерации изображений, если добавить текст, голос, видео и другие мультимодальные взаимодействия, потребность будет еще более труднооценимой."

Это всего лишь потребности в выводах со стороны конечных пользователей. Для пользователей B-класса потребности в выводах еще более масштабны. Один из руководителей Huari Zhikuan сообщил Huxiu, что заводы по производству автомобилей начинают строительство центров интеллектуальных вычислений с масштабов в десятки тысяч P, "и среди наших клиентов, помимо крупных заводов, именно заводы по производству автомобилей имеют наибольшие потребности в вычислительной мощности."

Однако, если связать огромное количество требований к выводу и пузырь вычислительной мощности, история становится совершенно абсурдной. Почему так много требований к выводу все еще приводит к пузырю вычислительной мощности?

Некоторые поставщики вычислительных мощностей сообщили Huxiu, что для удовлетворения такого огромного спроса на выводы, провайдеры интеллектуальных вычислений должны оптимизировать вычислительную мощность с помощью инженерных технологий, таких как сокращение времени запуска, увеличение объема хранения, сокращение задержки вывода, повышение пропускной способности и точности вывода и т.д.

Не только это, но и проблема несоответствия спроса и предложения, упомянутая выше, также в значительной степени связана с проблемами с чипами. В этой связи информированные источники из отрасли сообщили HuXiu, что разрыв между некоторыми отечественными картами и NVIDIA все еще довольно велик, их собственные показатели развиваются неравномерно. Даже если в одной и той же марке накапливается много карт, слабые места все равно остаются, что приводит к тому, что единичный кластер не может эффективно завершить обучение и вывод AI.

Этот «эффект узкого места» означает, что даже если создать вычислительный кластер с помощью массового стекания чипов, если проблема узкого места не будет эффективно решена, общая эффективность кластера все равно будет ограничена, что затруднит эффективную поддержку сложного обучения и масштабных задач вывода больших AI моделей.

На самом деле, инженерные вызовы на уровне вычислительной мощности и ограничения чипов действительно серьезны, но многие глубокие потребности в вычислительной мощности не были эффективно удовлетворены, и настоящая "точка разрыва" часто возникает в приложенческой экосистеме выше уровня вычислительной мощности, особенно в серьезном дефиците вертикальных моделей на уровне L2 (то есть для конкретных отраслей или сценариев).

В медицинской промышленности существует огромная "дыра", которую необходимо заполнить. Эффект притяжения талантов является долгосрочной структурной проблемой в отечественной медицинской системе, где优秀医生 сосредоточены в трёх крупных больницах в крупных городах. Но когда отрасль надеется, что большие медицинские модели позволят качественным медицинским ресурсам опуститься вниз, возникает более фундаментальная проблема: как создать надежное пространство медицинских данных?

Поскольку необходимо обучить крупную модель, обладающую способностью к лечению на всех этапах заболевания, данные являются ключевым условием. Но проблема в том, что для формирования знаний в крупной модели необходимо огромное количество данных, охватывающих все этапы заболевания, все возрастные группы, все полы и все регионы. А реальность такова, что уровень открытости медицинских данных составляет менее 5%.

Директор информационного отдела одной из трёх крупных больниц сообщил, что из 500 ТБ диагностических данных, производимых его больницей ежегодно, менее 3% действительно могут быть использованы для обучения ИИ. Более того, данные по редким заболеваниям и хроническим заболеваниям, которые составляют 80% ценности карты заболеваний, из-за их конфиденциальности долгое время находятся в "островах данных" различных медицинских учреждений.

Если такая точка разрыва не может быть решена, производственная цепочка не может сформировать замкнутый контур. Естественно, спрос на вычислительные мощности не будет удовлетворен, и понятно, что это далеко за пределами возможностей традиционных поставщиков вычислительной инфраструктуры, которые предоставляют только «карты и электричество», с которыми можно иметь дело самостоятельно.

Тем не менее, в настоящее время на рынке появляется группа новых поставщиков интеллектуальных вычислительных услуг. Эти компании больше не ограничивают себя простым предоставлением оборудования или арендой вычислительной мощности; они также могут создавать профессиональные команды алгоритмистов и команд отраслевых экспертов, активно участвуя в разработке и оптимизации AI-приложений для клиентов.

В то же время, сталкиваясь с различными проблемами, такими как неправильное распределение ресурсов и уровень использования вычислительной мощности, в разных местах на самом деле разрабатываются различные политики субсидирования вычислительной мощности в зависимости от потребностей местной промышленности. Среди них "ваучеры на вычислительную мощность" выступают в качестве способа субсидирования, который напрямую снижает затраты предприятий на использование вычислительной мощности. Однако для текущего этапа китайской индустрии интеллектуальных вычислений простая политика "экстренной помощи" вряд ли сможет кардинально изменить ситуацию.

Сегодня в индустрии интеллектуальных вычислений необходима экосистема, которая будет "кроветворной".

Посмотреть Оригинал
Содержание носит исключительно справочный характер и не является предложением или офертой. Консультации по инвестициям, налогообложению или юридическим вопросам не предоставляются. Более подробную информацию о рисках см. в разделе «Дисклеймер».
  • Награда
  • комментарий
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить