Самое мощное в истории решение для инфраструктуры искусственного интеллекта: Nvidia выпустила платформу Vera Rubin, стоимость одного токена снизилась в 10 раз

robot
Генерация тезисов в процессе

IT之家17 марта — сегодня (17 марта) на конференции GTC 2026, проходящей в Сан-Хосе, штат Калифорния, Nvidia представила платформу Vera Rubin AI для продвижения развития интеллектуальных агентов AI (Agentic AI).

Основатель и генеральный директор Nvidia Дженсен Ху подчеркнул, что Vera Rubin является прорывом между поколениями, ознаменуя начало крупнейших в истории инфраструктурных проектов компании, охватывающих весь жизненный цикл AI — от масштабного предварительного обучения до реального времени для рассуждений интеллектуальных агентов.

Этот шаг означает официальный выход Nvidia на рынок прямых продаж традиционных CPU, что не только позволяет конкурировать с Intel и AMD, но и бросает вызов мировым гигантам облачных вычислений, использующим собственные процессоры на базе архитектуры Arm.

IT之家 ссылается на блог, в котором говорится, что для значительного повышения эффективности базовых вычислений Vera CPU оснащена одним чипом с 88 ядрами и 144 потоками. Этот чип использует глубоко кастомизированное ядро Arm v9.2-A Olympus от Nvidia, которое достигло впечатляющего прироста IPC (инструкций на такт) в 1,5 раза по сравнению с предыдущими поколениями.

Одновременно с этим архитектура впервые вводит технологию «пространственного многопоточности» (Space Multithreading), которая с помощью физической изоляции компонентов конвейера позволяет нескольким потокам одновременно работать на одном ядре, полностью устраняя потери вычислительной мощности, связанные с очередями ресурсов традиционных методов многопоточности.

На уровне вычислительной мощности нового поколения платформа NVL72 достигла прорыва в эффективности. Она соединяет 72 GPU Rubin и 36 CPU Vera через шину NVLink6.

По сравнению с предыдущей платформой Blackwell, эта система требует всего четверти GPU для обучения гибридных экспертных больших моделей (MoE), при этом пропускная способность рассуждений на ватт увеличилась в 10 раз, а стоимость одного токена снизилась в десять раз.

Кроме того, для проверки результатов AI-моделей создана платформа Vera CPU, интегрирующая 256 жидкостных охлаждаемых CPU, которая вдвое превосходит по эффективности традиционные CPU и обеспечивает увеличение скорости на 50%.

Для удовлетворения требований низкой задержки и длинных контекстов в системах интеллектуальных агентов Nvidia представила ускоритель рассуждений Groq3LPX. Эта система включает 256 процессоров LPU, и в сочетании с Vera Rubin пропускная способность рассуждений на мегаватт достигает максимума — 35-кратного увеличения.

В области хранения данных новая архитектура BlueField-4STX создает нативную инфраструктуру хранения AI. Благодаря новой платформе DOCA Memos система способна эффективно обрабатывать огромные объемы ключ-значение (KV) кешированных данных, созданных крупными языковыми моделями, значительно снижая энергопотребление и увеличивая пропускную способность рассуждений до 5 раз, что обеспечивает более быстрый многократный диалог AI.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить