420 млн! Yunsky Lifefly відкриває новий рік з перемогою, отримавши контракт на проект AI-інференс-кластеру з тисячею карт у Чжанцзяні

MaticHoleFiller · 2026-03-21T04:13:51+00:00

Yuntu Lifai отримала перемогу у конкурсі на реалізацію проекту інфраструктури підтримки AI у місті Чжанцзянь, побудує кластер обчислювальних ресурсів на основі власних прискорювачів AI для логічного висновку, оптимізує архітектуру логічного висновку великих моделей, підвищить ефективність системи та підтримуватиме цифрові застосунки у сферах державного управління та промисловості. Одночасно компанія продовжить дослідження у сфері розробки чипів для AI логічного висновку, плануючи випустити оптимізовані чипи Prefill і Decode, щоб знизити витрати на логічний висновок великих моделей.

MaticHoleFiller

2026-03-21 04:13:51

Генерація анотацій у процесі

（Джерело: YunTianLiFei）

Нещодавно YunTianLiFei отримала перемогу у конкурсі на будівництво інфраструктури нової якісної продуктивності для підтримки AI-інфраструктури міста Чжаньцзянь. Відповідно до плану проекту, компанія на основі власних розробок китайських AI-обчислювальних карток для прискорення AI-розрахунків братиме участь у створенні кластеру обчислювальних ресурсів для AI-розпізнавання та сприятиме адаптації і розгортанню китайських великих моделей, таких як DeepSeek, у відповідних сферах застосування, забезпечуючи обчислювальну інфраструктуру для цифровізації уряду та промисловості.

Створення інфраструктури для обчислювальних ресурсів у великих моделях

Цей проект передбачає системний дизайн кластеру AI-обчислювальних ресурсів, орієнтований на потреби у розпізнаванні великих моделей.

Під час розпізнавання великих моделей різні етапи обчислень вимагають різних ресурсів системи. У сучасній індустрії поширена архітектура розподілу процесів “Prefill–Decode”, яка оптимізує розподіл ресурсів для різних етапів і підвищує загальну ефективність роботи системи.

За цією архітектурою, етап Prefill відповідає за довгий контекст і обчислення, що вимагають високої обчислювальної потужності та пропускної здатності; етап Decode постійно генерує токени і більш чутливий до затримок системи. У процесі реалізації проекту буде враховано особливості кожного етапу для оптимізації ресурсів і систем.

Крім того, з урахуванням зростання довжини контексту моделей, значна кількість проміжних станів зберігатиметься у вигляді кешу KV. Враховуючи цю особливість, у системному дизайні буде проведена оптимізація співпраці між обчислювальними, сховищними та мережевими компонентами для підвищення швидкості доступу до даних і загальної продуктивності системи.

Щодо мережевої архітектури, система використовуватиме єдину високошвидкісну мережу, побудовану на 400G оптичних лініях, для створення фізичної мережі кластеру, що забезпечить високий пропуск і низьку затримку між вузлами, а також дозволить масштабуватися від десятків карток у одному вузлі до тисяч карток у кластері для задоволення потреб різних AI-застосувань.

Після завершення всього проекту буде створено інфраструктуру обчислювальних ресурсів для розпізнавання великих моделей, яка забезпечить стабільну підтримку для відповідних сфер застосування.

Постійний розвиток технологій AI-обчислювальних чипів і систем

Згідно з планом проекту, створення кластеру AI-обчислювальних ресурсів буде здійснено у три етапи, з використанням власних китайських прискорювачів AI-розрахунків YunTianLiFei.

Перший етап передбачає розгортання прискорювача YunTianLiFei X6000; у майбутньому планується перший запуск новітніх чипів компанії.

У сфері розробки AI-обчислювальних чипів YunTianLiFei активно просуває технологічні рішення для різних етапів розпізнавання. Відповідно до стратегічного плану компанії, у майбутньому будуть поступово випускатися чипи, оптимізовані для етапу Prefill, а також для низької затримки у етапі Decode, з подальшою системною оптимізацією для підвищення загальної ефективності розпізнавання.

Зокрема, перший чип компанії, орієнтований на довгий контекст, DeepVerse100, який оптимізовано для сценаріїв довгого контексту, планується завершити у поточному році і розгорнути у відповідних системах обчислень.

Щодо довгострокового плану, компанія пропонує “Програму 1001”, яка має на меті досягти цілі “сто мільярдів токенів за одну копійку” і постійно знижувати вартість розпізнавання великих моделей через оптимізацію архітектури чипів і систем обчислень.

У майбутньому компанія продовжить дослідження і розробки технологій AI-обчислювальних чипів, сприяючи поширенню штучного інтелекту у різних галузях.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.