Гуанфу цінхуі: NVIDIA ( NVDA.US ) нова платформа посилює конкурентоспроможність застосунків Agent, штучний інтелект推理驱动存储周期持续向上

robot
Генерація анотацій у процесі

Гонфу цзуньчжень опублікувала аналітичний звіт, у якому зазначено, що NVIDIA (NVDA.US) продемонструвала Vera Rubin POD на GTC, зосереджуючись на підвищенні конкурентоспроможності лінійок продуктів для кластеризованих обчислень та інференційних обчислень для застосувань Agent. Час прориву штучного інтелекту, інновації моделей і закладання основ CAPEX, спільний розвиток ланцюга індустрії ШІ; інференція ШІ сприяє постійному зростанню циклу зберігання даних, розширенню виробництва та оновленню обладнання. Рекомендується звернути увагу на ключові компанії, що отримують вигоду від ланцюга індустрії.

Основні точки зору Гонфу цзуньчжень такі:

Випуск платформи Vera Rubin POD від NVIDIA

Згідно з офіційним сайтом NVIDIA, 16 березня 2026 року, на GTC була представлена Vera Rubin POD, яка включає 5 нових систем рівня стійки, спеціально створених для навантажень Agentic AI. Оскільки навантаження Agentic вимагають високої пропускної здатності, мінімальної затримки для інференцій, щільних CPU-песочниць і великої внутрішньої пам’яті для контексту, NVIDIA зосередилася на підвищенні конкурентоспроможності для застосувань Agent у кластеризованих обчислювальних лінійках. Vera Rubin POD поділяється на два типи стійок: (1) MGXNVL — Vera Rubin NVL72, внутрішньо з’єднана через NVLink для виконання основних GPU-обчислень; (2) MGXETL — включає стійки Groq3 LPX, Vera CPU, BlueField-4 STX для зберігання та Spectrum-6 SPX для мережевих з’єднань, які з’єднані безпосередньо через SpectrumX Ethernet або чіпи Groq3 LPU для спільної роботи. За оцінками за схемою на офіційному сайті, один SuperPOD Vera Rubin 1152 складається з 16 стійок Vera Rubin NVL72, 2 стійок Vera CPU, 10 стійок Groq3 LPX, 2 стійки BlueField-4 STX та 10 стійок Spectrum-6 SPX, що демонструє гетерогенну архітектуру системи, орієнтовану на Agentic AI.

Стійка Groq3 LPX використовується для прискорення декодування.

Стійка Groq3 LPX інтегрує 256 процесорів LPU, обладнаних 128 ГБ внутрішньої пам’яті SRAM та пропускною здатністю 640 ТБ/с. У поєднаній архітектурі Vera Rubin NVL72 і LPX GPU відповідає за попереднє заповнення та обчислення уваги на етапі декодування, тоді як LPU прискорює обчислення FFN на етапі декодування, прискорюючи процес розкоджування кожного вихідного токена на кожному рівні, а також взаємодіє з Vera Rubin через спеціалізоване з’єднання Spectrum-X. За даними офіційного сайту NVIDIA, при 400 TPS на користувача, комбінація Vera Rubin NVL72 і LPX забезпечує до 35-кратного зростання TPS на мегават у порівнянні з NVIDIA G200 NVL72, що підвищує загальну продуктивність системи та краще підходить для низьколатентних, високоінтерактивних застосувань Agent.

Стійка Vera CPU підтримує середовище RL/Agent Sandbox

Стійка Vera CPU інтегрує 256 процесорів Vera CPU, виконана за високоплотною системою рідинного охолодження, одна стійка може підтримувати понад 22 500 одночасних середовищ навчання з підсиленням (RL) або агентських пісочниць для тестування, виконання та верифікації результатів Vera Rubin NVL72 і LPX.

Ризики

Розвиток індустрії ШІ та попит можуть бути нижчими за очікувані; обсяг поставок серверів ШІ може бути меншим за очікуваний, технології та продукти вітчизняних виробників можуть відставати від плану.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити