Облачная платформа Yuntian Lifei для AI-вычислений на базе 千卡 успешно реализована в Чжаньцзянь, создавая образец экологической системы «Национальные модели и национальные чипы».

robot
Генерация тезисов в процессе

12 марта компания YunTianLiFei (688343) выиграла тендер на строительство инфраструктуры поддержки новой производственной силы в рамках проекта AI-сквозного проникновения в городе Чжаньцзян, сумма контракта составила 420 миллионов юаней. Проект будет основан на отечественной ускоряющей карте для AI-выводов, разработанной YunTianLiFei, и создаст отечественный кластер из тысячи карт для AI-выводов. Этот кластер будет оснащён отечественными крупными моделями, такими как DeepSeek, и предоставит более удобные и недорогие возможности AI для государственных служб, промышленности и различных приложений, а также станет образцом AI-экосистемы с «национальными моделями» и «национальными чипами».

Искусственный интеллект переходит от «предобучения» к «выводу»

Кластер интеллектуальных вычислений — это основная инфраструктура эпохи искусственного интеллекта. В прошлом многие отечественные центры интеллектуальных вычислений обычно строились по модели «обучение и вывод в одном». В то же время, создаваемый в Чжаньцзяне кластер ориентирован исключительно на задачи вывода AI, предназначен для различных отраслевых сценариев и напрямую поддерживает цифровизацию традиционных предприятий.

Известно, что Чжаньцзян — родной город основателя отечественной крупной модели DeepSeek, Вэньфэна Ляна. В последние годы местные власти активно исследуют применение DeepSeek+. После выпуска DeepSeek-R1 в начале 2025 года, в Чжаньцзяне завершили локальное развертывание, и крупная модель DeepSeek-R1 на отечественной технологической базе впервые запущена в государственном облаке Чжаньцзяна. Эта модель не только обрабатывает общие государственные дела, но и продолжает обучаться местным отраслевым знаниям и диалектам, постепенно формируя уникальную «мудрость Чжаньцзяна».

Создаваемый YunTianLiFei AI-выводной кластер также будет глубоко интегрирован с отечественными моделями, такими как DeepSeek, чтобы обеспечить вычислительные ресурсы для большего числа отраслевых приложений.

В сценариях применения крупных моделей системы вывода обычно требуют одновременного удовлетворения трёх требований: высокой одновременной обработки, высокой пропускной способности и низкой задержки. Для повышения общей эффективности в индустрии широко используется архитектура вывода с разделением на этапы «предзаполнение» (Prefill) и «декодирование» (Decode), что позволяет оптимизировать ресурсы на каждом этапе и повысить производительность системы. В этом контексте совместное проектирование вычислительных мощностей, памяти и сети становится важным конкурентным преимуществом AI-инфраструктуры.

Создаваемый в Чжаньцзяне кластер из тысячи карт основан именно на этой концепции. Он использует отечественный AI-выводной чип, разработанный YunTianLiFei, и реализует технический подход «предпочтительно оптимизировать Prefill, учитывать Decode». За счёт целенаправленной настройки вычислительных ресурсов и пропускной способности памяти в архитектуре чипа система сохраняет высокую пропускную способность даже при выводе в условиях длинных контекстов.

В части сетевого соединения система использует унифицированную высокоскоростную архитектуру, построенную на 400G оптоволоконной сети, что обеспечивает высокую пропускную способность и низкую задержку между узлами. По сравнению с традиционными подходами, когда внутри узлов и между ними используют разные протоколы, такая однородная архитектура уменьшает накладные расходы на преобразование протоколов и упрощает развертывание системы.

В части масштабируемости эта архитектура поддерживает как расширение на десятки карт в одном узле, так и плавное масштабирование до тысячи карт, что позволяет адаптировать её под разные требования AI-приложений.

Кроме того, для снижения нагрузки на KV-кэш при выводе крупных моделей система осуществляет совместную оптимизацию на уровнях вычислительной и памяти сети. Совместное управление вычислительной и хранилищной сетью значительно повышает эффективность чтения данных и обеспечивает стабильную работу модели даже при длинных контекстах. Благодаря архитектуре чипов, сетевому соединению и системному управлению, этот кластер демонстрирует явные преимущества в эффективности и стоимости, предлагая более экономичное решение для масштабных AI-приложений.

Разработка собственных чипов для снижения стоимости вывода

Сообщается, что данный AI-выводной кластер будет построен в три этапа и полностью использует отечественные ускоряющие карты для AI-выводов, разработанные YunTianLiFei.

Первый этап предусматривает развертывание ускоряющих карт серии X6000; на втором и третьем этапах планируется установка новейших чипов компании.

По планам, в течение следующих трёх лет YunTianLiFei выпустит три поколения AI-выводных чипов. На первом этапе будет представлен чип Prefill, оптимизированный для сценариев с длинными контекстами, повышающий вычислительную эффективность и доступ к памяти, чтобы обеспечить базовые вычислительные ресурсы для OpenClaw и различных AI-агентов. На втором этапе разрабатываются чипы, ориентированные на минимизацию задержек на этапе Decode, для повышения реального времени вывода. Третий этап предполагает системную координацию для общего повышения производительности Prefill и Decode, приближая задержки вывода к миллисекундным значениям.

Первый чип Prefill — DeepVerse100 — планируется завершить в текущем году и в первую очередь развернуть в Чжаньцзянском кластере. В долгосрочной перспективе YunTianLiFei планирует реализовать «План 1001», цель которого — «сто миллиардов токенов за одну копейку», то есть снизить стоимость вывода крупных моделей за счёт совместной оптимизации чипов и систем.

По мнению отрасли, вычислительные мощности для вывода станут ключевой инфраструктурой для масштабного внедрения AI. Тот, кто сможет обеспечить более высокую эффективность и меньшие затраты на стабильный вывод в больших масштабах, получит преимущество в новой волне конкуренции в индустрии искусственного интеллекта. Создание этого AI-выводного кластера в Чжаньцзяне не только обеспечит важную вычислительную базу для цифровой трансформации местных предприятий, но и создаст практическую платформу для совместного развития отечественных моделей и чипов. В глубокой интеграции «национальных моделей» и «национальных чипов» инфраструктура AI постепенно переходит от технологических исследований к масштабному применению, открывая новые возможности для следующего этапа развития индустрии искусственного интеллекта.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить