Найпотужніший у історії план інфраструктури штучного інтелекту: Nvidia випустила платформу Vera Rubin, вартість одного токена знизилася до 1/10

robot
Генерація анотацій у процесі

IT之家17 березня повідомляє, що сьогодні (17 березня) на конференції GTC 2026, яка проходить у Сан-Хосе, Каліфорнія, NVIDIA презентувала платформу Vera Rubin AI для просування розвитку агентного штучного інтелекту (Agentic AI).

Засновник і генеральний директор NVIDIA Дженсен Ху підкреслив, що Vera Rubin є міжпоколінним проривом, що ознаменовує початок найбільшого в історії інфраструктурного будівництва компанії, яке охоплює весь життєвий цикл AI — від масштабного попереднього навчання до реального часу інтелектуального агентного виведення.

Цей крок означає офіційний вихід NVIDIA на традиційний ринок прямого продажу ЦПУ, що не лише ставить її у прямий конфлікт з Intel і AMD, а й кидає виклик глобальним гігантам хмарних обчислень, які розробляють процесори на архітектурі Arm.

IT之家 посилається на блоговий огляд, у якому зазначається, що для значного підвищення ефективності базових обчислень, Vera CPU на одному чіпі має 88 ядер і 144 потоки. Цей чіп використовує глибоко налаштовану NVIDIA архітектуру Arm v9.2-A Olympus, яка досягла вражаючого приросту IPC (інструкцій за такт) у 1,5 разу між поколіннями.

Одночасно, ця архітектура вперше вводить технологію “просторового багатопоточності” (space multithreading), яка за допомогою фізичного ізоляції компонентів конвеєра дозволяє кільком потокам одночасно працювати на одному ядрі, повністю позбавляючися втрат обчислювальної потужності через черги ресурсів традиційної багатопоточності.

На рівні обчислювальної потужності ядра, нове покоління NVL72 забезпечує прорив у продуктивності. Ця система з’єднує 72 GPU Rubin і 36 CPU Vera через NVLink6.

У порівнянні з попередньою платформою Blackwell, ця система здатна завершити тренування гібридної експертної моделі (MoE) із чотирикратним меншим кількістю GPU, одночасно підвищуючи пропускну здатність для виведення на ватт до 10 разів і знижуючи вартість обробки одного токена до десятої частини.

Крім того, для перевірки результатів AI-моделей створена платформа Vera CPU з 256 рідинних охолоджуваних CPU, яка має вдвічі вищу ефективність порівняно з традиційними CPU і швидкість на 50% вищу.

Щоб задовольнити потреби систем агентів у низькій затримці та довгому контексті, NVIDIA представила прискорювач для виведення Groq3LPX. Ця система містить 256 процесорів LPU і у поєднанні з Vera Rubin забезпечує до 35-кратного зростання пропускної здатності на мегават.

У сфері зберігання даних новий архітектурний блок BlueField-4STX створює AI-орієнтовану інфраструктуру зберігання. Завдяки новій платформі DOCA Memos ця система здатна ефективно обробляти величезні обсяги кешованих даних ключ-значення (KV), створених великими мовними моделями, значно знижуючи енергоспоживання та підвищуючи пропускну здатність для виведення до 5 разів, що забезпечує швидший багатокруговий AI-інтерактив.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити