Гуанфа Секьюритиз: новая платформа Nvidia (NVDA.US) укрепляет конкурентоспособность приложений Agent, цикл хранения данных, подкрепленный AI-умозаключениями, продолжает расти

robot
Генерация тезисов в процессе

Гуанфу Цзуньцзин опубликовала аналитический отчет, в котором говорится, что на GTC Nvidia (NVDA.US) продемонстрировала Vera RubinPOD, при этом особое внимание уделяется усилению конкурентоспособности линий продуктов для кластерных вычислений и inference-вычислений, ориентированных на приложения Agent. Время наступления эпохи AI — это время инноваций в моделях и закладки капитальных затрат (CAPEX), а также совместного развития цепочки индустрии AI; рост inference-вычислений стимулирует постоянное увеличение сроков хранения данных, расширение мощностей и обновление оборудования. Рекомендуется обратить внимание на ключевые компании цепочки индустрии, получающие выгоду.

Основные точки зрения Гуанфу Цзуньцзин следующие:

Nvidia представила платформу Vera Rubin POD

Согласно официальному сайту Nvidia, 16 марта 2026 года на GTC была продемонстрирована Vera RubinPOD, включающая 5 новых систем уровня рака для задач Agentic AI. Поскольку нагрузка Agentic требует высокой пропускной способности, очень низкой задержки inference, плотных CPU-песочниц и огромных объемов внутренней памяти для контекста, Nvidia в этот раз сосредоточилась на усилении конкурентоспособности линий продуктов для кластерных вычислений и inference-вычислений, ориентированных на приложения Agent. Vera Rubin POD делится на два типа стоек: (1) стойка MGXNVL — Vera Rubin NVL72, внутри которой соединение осуществляется через NVLink, выполняя основные GPU-вычисления; (2) стойка MGXETL — включает стойки Groq3 LPX, Vera CPU, BlueField-4 STX для хранения данных и Spectrum-6 SPX для сети, все они связаны напрямую через Ethernet SpectrumX или чипы Groq3 LPU для совместной работы. Согласно схеме на сайте, один SuperPOD Vera Rubin 1152 состоит из 16 стоек Vera Rubin NVL72, 2 стоек Vera CPU, 10 стоек Groq3 LPX, 2 стоек BlueField-4 STX и 10 сетевых стоек Spectrum-6 SPX, что отражает архитектуру гетерогенной системы, построенной вокруг задач Agentic AI.

Стойка Groq3 LPX предназначена для ускорения декодирования.

Стойка Groq3 LPX включает 256 процессоров LPU, оснащена 128 ГБ встроенной SRAM и пропускной способностью 640 ТБ/с. В комбинации Vera Rubin NVL72 и LPX GPU в основном отвечает за предварительную обработку (Prefill) и вычисление Attention на этапе декодирования, тогда как LPU ускоряет вычисление FFN на этом этапе, ускоряя процесс декодирования каждого выходного токена на каждом слое, а также взаимодействует с Vera Rubin через специально настроенное соединение Spectrum-X. Согласно раскрытию на официальном сайте Nvidia, при условии 400 TPS на пользователя, комбинация Vera Rubin NVL72 и LPX обеспечивает до 35-кратного увеличения TPS на мегаватт по сравнению с Nvidia GB200 NVL72, что повышает общую производительность системы и лучше подходит для сценариев Agent с низкой задержкой и высокой интерактивностью.

Стойка Vera CPU обеспечивает поддержку среды RL/Agent sandbox

Стойка Vera CPU включает 256 процессоров Vera CPU, использует высокоплотное жидкостное охлаждение, и одна стойка может поддерживать более 22 500 параллельных сред обучения с подкреплением (RL) или агентских песочниц, предназначенных для тестирования, выполнения и проверки результатов Vera Rubin NVL72 и LPX.

Риски

Развитие индустрии AI и спрос на нее могут оказаться ниже ожидаемого; объем поставок AI-серверов может оказаться ниже прогнозируемого; технологический прогресс и развитие продукции отечественных производителей могут не оправдать ожиданий.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить