Стремительный рост спроса на логические вычислительные мощности: компании отрасли ускоряют развертывание

Журналист сайта Цзиньцзюаньжибао Ван Цзинжю

По мере того, как технологии генеративного искусственного интеллекта постепенно переходят от «обучения моделей» к масштабной коммерческой реализации, потребление вычислительных ресурсов, связанное с обучением, постепенно смещается в сторону постоянных требований к вычислительной мощности, ориентированных на выводы. 17 марта на конференции GTC генеральный директор NVIDIA Дженсен Ху заявил, что наступил переломный момент на рынке AI-выводов, AI полностью перешел от стадии обучения к стадии вывода и исполнения, а спрос на вычислительные ресурсы для вывода растет экспоненциально.

«По мере расширения масштабов применения генеративного искусственного интеллекта скорость роста потребностей в вычислительной мощности для вывода может значительно превзойти потребности в обучении. С одной стороны, происходит взрывной рост спроса на приложения, ускоряется внедрение генеративного AI и интеллектуальных агентов, а высокочастотное взаимодействие пользователей вызывает экспоненциальный рост запросов на выводы; с другой стороны, продолжаются технологические прорывы в области специализированных чипов для вывода, жидкостного охлаждения и оптоволоконных соединений, что значительно повышает эффективность вычислений и параллельность, создавая базу для масштабных развертываний», — отметил исследователь компании Qianhai PaiPaiWang в Шэньчжэне Чжан Пеньюань в интервью «Цзиньцзюаньжибао».

Согласно прогнозам отраслевых аналитиков, важность вычислительных ресурсов для вывода продолжает расти. Международная компания по анализу данных IDC прогнозирует, что к 2027 году доля вычислительных ресурсов для вывода в общем объеме вычислительных мощностей в Китае превысит 70%. Основатель и CEO China IDC圈 Хуан Чао заявил, что к 2026 году индустриальный интеллект достигнет стадии «цветения», и применение вычислительных ресурсов перейдет от «доминирования обучения» к «управляемому выводам», а взрывной рост спроса на вычислительные мощности для вывода скоро полностью начнется.

В условиях быстрого роста спроса на вычислительные ресурсы для вывода отечественные компании по всей цепочке производства активно ускоряют разработку технологий и расширяют продуктовую линейку. На уровне чипов несколько производителей уже выпускают чипы, оптимизированные для сценариев вывода. В отличие от традиционных чипов для обучения, чипы для вывода делают особый акцент на контроле энергопотребления, эффективности затрат и гибкости развертывания, что обеспечивает широкие возможности применения как в облаке, так и на периферии.

Например, компания Shenzhen CloudTianLiFei Technology Co., Ltd. (далее «CloudTianLiFei») сосредоточена на NPU и определила технологический маршрут GPNPU для мощных чипов в сценариях облачного вывода, глубоко оптимизировав матричные, векторные блоки, уровни памяти и использование эффективной пропускной способности. Цель — экспоненциально снизить стоимость токенов и ускорить масштабное и доступное внедрение крупных моделей.

К 2025 году CloudTianLiFei достигнет выручки в 1,308 миллиарда юаней, что на 42,57% больше по сравнению с предыдущим годом. Руководитель компании отметил в интервью «Цзиньцзюаньжибао»: «Для предприятий, по мере того как конкуренция в отрасли смещается с масштабов обучения к эффективности вывода, стоимости доставки и прибыльности систем, те, кто сможет раньше обеспечить скоординированную работу аппаратного обеспечения, хранения и программного обеспечения, получат больше шансов занять лидирующие позиции в эпоху вывода».

На уровне серверов и систем ведущие производители также продолжают запускать платформы вычислительных ресурсов, оптимизированные для сценариев вывода. Например, компания Inspur Electronic Information Industry Co., Ltd. выпустила сервер для вывода на базе «YuanNao R1», который поддерживает 16 стандартных PCIe-карт двойной ширины, позволяя развернуть модель DeepSeek-671B на одном устройстве; также выпущен сервер для вывода на базе CPU «YuanNao», который позволяет быстро развернуть и эффективно запустить новые модели, такие как DeepSeek-R132B и QwQ-32B.

Одновременно строительство инфраструктуры вычислительных ресурсов идет полным ходом. Ранее в стране большинство центров интеллектуальных вычислений использовали интегрированные модели обучения и вывода. 12 марта CloudTianLiFei выиграла тендер на строительство инфраструктуры поддержки новых производственных сил AI в городе Чжаньцзянь провинции Гуандун, проект ориентирован на создание AI-кластеров для вывода, предназначенных для различных отраслевых сценариев, что станет примером внедрения AI в традиционные отечественные производства.

Генеральный директор Beijing Zhiyu Zhi Shan Investment Management Co., Ltd. Хэ Ли считает, что в этой трансформации первыми выиграют высокопроизводительные чипы для вывода, HBM и программное обеспечение полного стека. Сценарии вывода требуют минимальной задержки, высокой пропускной способности и высокой энергоэффективности, поэтому специализированные архитектуры, такие как LPU и ASIC, ускорят замену универсальных вычислительных блоков, а технологии хранения, такие как HBM4, станут ключевыми для преодоления узких мест по пропускной способности. В то же время вычислительные ресурсы перемещаются из дата-центров к периферии, возрастает спрос на плотные рамы для вывода и передовые системы охлаждения, а также за счет квантования моделей, сжатия параметров и других методов оптимизации компиляции индустрия переходит от аппаратных стеков к совместной работе аппаратного и программного обеспечения.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить