Caitu Securities: Architectural Innovation Breaks Through Large Model Reasoning Latency Bottleneck, Vast Market Space Expected to Scale Rapidly

robot
Генерация тезисов в процессе

Цайтун Цзюаньцзин опубликовала аналитический отчет, в котором говорится, что LPU — это чип нового поколения для стадии вывода больших моделей, основанный на архитектуре TSP. Компания считает, что LPU выигрывает за счет низкой задержки при выводе и имеет потенциал для быстрого проникновения на рынок. В отчете отмечается высокая перспективность роста LPU и возможность получения PCB-рынка при поставках в шкафах, а также рекомендуются к вниманию: Zhimei Zhinen (001339.SZ) (участие в YuanChuan Micro), Xingchen Technology (301536.SZ) (многократное увеличение инвестиций в YuanChuan Micro), Shudian Co. (002463.SZ) (поставщик PCB для Nvidia), Shenghong Technology (300476.SZ) (поставщик PCB для Nvidia), Shennan Circuit (002916.SZ).

Основные точки зрения Цайтун Цзюаньцзин:

LPU — чип нового поколения для стадии вывода больших моделей, основанный на архитектуре TSP

LPU — это новая архитектура чипа, специально разработанная для последовательных вычислительных задач с высокой плотностью, с ядром на базе архитектуры TSP, включающая пять основных модулей. В ней разбита классическая пятиуровневая конвейерная обработка процессора по всему чипу, что устраняет сложность аппаратного обеспечения и обеспечивает определенность порядка и времени выполнения команд. В архитектуре TSP компилятор может напрямую обращаться к низкоуровневому состоянию аппаратного обеспечения чипа и точно его контролировать, реализуя концепцию программно-определенного аппаратного обеспечения.

LPU сокращает задержки при выводе больших моделей, улучшая пользовательский опыт

Во время вывода больших моделей возникает задержка, которая напрямую влияет на качество пользовательского опыта. Основная задержка происходит на этапе декодирования, узким местом является пропускная способность памяти. Благодаря более высокой пропускной способности памяти LPU сокращает задержки при выводе больших моделей. Кроме того, модели, основанные на LPU, обладают не только более высокой скоростью вывода, но и более выгодной ценой, что дополнительно повышает пользовательский опыт.

LPU обладает широкими перспективами развития и уже находится на начальной стадии массового производства

В настоящее время объем потребления токенов значительно вырос: в начале 2024 года среднесуточное потребление токенов в Китае составляло 100 миллиардов, а к февралю 2026 года основные большие модели достигли общего суточного потребления токенов в 180 триллионов, что способствует быстрому росту рынка чипов для вывода. LPU способен снизить задержки при выводе больших моделей, и, по мнению аналитиков, он имеет потенциал для постепенного проникновения на рынок чипов для вывода, обладая высоким потенциалом роста. В настоящее время LPU находится на начальной стадии массового производства, и объем поставок скоро начнется.

Риск-менеджмент: риск недоисполнения технологического прогресса в области ИИ; риск недостижения ожидаемых результатов в развитии больших моделей; риск недоразвития отрасли LPU.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить