Microsoft Azure дата-центры опережают график, полностью интегрированы с архитектурой следующего поколения вычислительных мощностей NVIDIA

На выставке потребительской электроники 2026 года (CES) был представлен платформа NVIDIA Rubin, а вместе с ней продемонстрирована и готовность к развертыванию Microsoft Azure (международной версии). Долгосрочная стратегия Microsoft в области центров обработки данных была разработана для таких моментов, позволяя следующему поколению систем NVIDIA прямо интегрироваться в нашу инфраструктуру. Еще несколько лет назад мы предсказали тенденции в отрасли, что позволило инфраструктуре заранее удовлетворить требования к электроэнергии, охлаждению, памяти и сети. Наша долгосрочная партнерская работа с NVIDIA гарантирует, что Rubin сможет напрямую интегрироваться в передовой платформенный дизайн Microsoft Azure (международной версии).

01

Создано для будущего

AI-центры обработки данных Microsoft Azure (международной версии) были разработаны для ускорения будущего вычислений. Это позволяет бесшовно интегрировать стойки NVIDIA Vera Rubin NVL72 в крупнейшую следующего поколения AI-суперфабрику Microsoft Azure (международной версии), от Висконсина до Атланты, поддерживая эту функцию как на существующих площадках Fairwater, так и на будущих новых проектах.

Современная AI-инфраструктура NVIDIA требует значительного обновления по электроэнергии, охлаждению и оптимизации производительности, и опыт Microsoft Azure (международной версии) на площадке Fairwater и за несколько лет множества циклов обновлений показывает, что мы способны гибко улучшать и расширять инфраструктуру AI-технологий по мере развития технологий.

02

Более зрелая

Масштаб и производительность Azure

Microsoft имеет многолетний опыт в проектировании и развертывании масштабируемой AI-инфраструктуры, что получило широкое признание на рынке. С каждым значительным прогрессом в технологиях AI эти инфраструктуры также эволюционируют. Поддерживая синхронизацию с каждой новой генерацией ускоренной вычислительной инфраструктуры NVIDIA, Microsoft быстро интегрирует инновационные технологии NVIDIA и осуществляет массовые поставки.

Мы сыграли важную роль в инкубации и рождении моделей, таких как GPT-3.5, через ранее развернутые NVIDIA Ampere и Hopper GPU, соединенные через сеть NVIDIA Quantum-2 InfiniBand, а также другие кластеры установили рекорды суперкомпьютерной производительности, что доказывает, что мы способны быстрее развертывать следующее поколение систем и достигать более высокой реальной производительности.

Мы продемонстрировали первое и самое массовое внедрение платформ NVIDIA GB200 NVL72 и NVIDIA GB300 NVL72, которые в формате стоек объединяют единый суперкомпьютер, значительно ускоряющий обучение AI-моделей и помогая Microsoft Azure (международной версии) оставаться предпочтительным выбором клиентов, ищущих передовые возможности AI-технологий.

03

Систематический подход Azure

Дизайн Microsoft Azure (международной версии) нацелен на то, чтобы вычисления, сети, хранилища, программное обеспечение и инфраструктура работали как интегрированная платформа. Созданные устойчивые преимущества обеспечивают прорыв в соотношении затрат и производительности, накапливающийся с течением времени.

Максимизация использования GPU требует оптимизации каждого уровня этой системы. Помимо того, что Microsoft Azure (международной версии) может заранее применять новые ускоренные вычислительные платформы NVIDIA, преимущества Microsoft Azure также проистекают от соседних платформ, таких как высокопроизводительное хранилище Blob, группы близости (Proximity Placement Groups), подверженные влиянию реальных производственных моделей, и проектирование на уровне регионов, а также такие уровни оркестрации, как CycleCloud и AKS, оптимизированные для низкорасходного планирования крупных кластеров.

Azure Boost и другие механизмы разгрузки решают узкие места IO, сети и хранилища, позволяя моделям плавно масштабироваться. Более быстрое хранилище подает данные большему числу кластеров, более мощная сеть поддерживает их работу, а оптимизированная оркестрация обеспечивает стабильность производительности от конца до конца. Инновации от первого лица усиливают этот замкнутый цикл: жидкостные теплообменные устройства удовлетворяют жестким требованиям к охлаждению, модули аппаратной безопасности Azure (HSM) разгружают задачи безопасности, а Azure Cobalt обеспечивает выдающуюся производительность и эффективность для универсальных вычислительных и AI-связанных задач. Эти интеграции обеспечивают высокоэффективное масштабирование всей системы, максимизируя ценность инвестиций в GPU.

С помощью такого систематического подхода Microsoft Azure (международной версии) полностью интегрирована с платформой Rubin. Новые системы и платформы от конца до конца, которые мы поставляем, были точно спроектированы с учетом всех технических требований Rubin.

04

Работа платформы NVIDIA Rubin

Суперчип NVIDIA Vera Rubin обеспечит NVFP4 производительность 50 PF на чип и NVFP4 производительность 3.6 EF на стойку, что обеспечивает пятилетний прирост производительности по сравнению с системой стойки NVIDIA GB200 NVL72.

Microsoft Azure (международной версии) уже включает в себя основные архитектурные предпосылки, необходимые для Rubin:

Эволюция NVIDIA NVLink: ожидаемая шестая генерация связующего канала NVIDIA NVLink в системе Vera Rubin NVL72 обеспечивает примерно 260 TB/s вертикальной пропускной способности, архитектура стоек Microsoft Azure (международной версии) была переработана, чтобы в полной мере использовать эти преимущества по пропускной способности и топологии.

Высокопроизводительная сеть с горизонтальным масштабированием: инфраструктура AI Rubin зависит от сверхбыстрого 1,600 Gb/s сети NVIDIA ConnectX-9, предоставляемой сетевой инфраструктурой Microsoft Azure (международной версии), которая была построена для поддержки масштабных AI-рабочих нагрузок.

Планирование охлаждения и плотности HBM4/HBM4e: стек памяти Rubin требует более узкого диапазона температурного контроля и более высокой плотности стоек; охлаждение, диапазон мощности и геометрия стоек Microsoft Azure (международной версии) уже были обновлены, чтобы справиться с аналогичными ограничениями.

Расширение памяти с помощью SOCAMM2: суперчип Rubin использует новую архитектуру расширения памяти; платформа Microsoft Azure (международной версии) уже интегрировала и проверила аналогичное поведение расширения памяти, чтобы постоянно предоставлять данные моделям в масштабных средах.

Увеличение размеров чипов GPU и многочиповая упаковка: Rubin переходит к более крупным местам для GPU и многочиповым конфигурациям. Цепочка поставок, механический дизайн и уровни оркестрации Microsoft Azure (международной версии) были предварительно оптимизированы для этих физических и логических характеристик расширения.

Методология Microsoft Azure (международной версии) при проектировании таких платформ, как Rubin, была подтверждена за несколько лет, включая следующие важные вехи:

Запуск крупнейшего в мире коммерческого развертывания InfiniBand через несколько поколений GPU.

Создание надежных уровней и технологий управления перегрузкой, что обеспечило более высокую степень использования кластеров и больший масштаб задач по сравнению с конкурентами, что отражено в нашем выпуске ведущих в отрасли результатов масштабных бенчмарков. Например, многомодульный MLPerf запуск, который конкуренты никогда не воспроизводили.

Совместная разработка AI-центра обработки данных с Grace Blackwell и Vera Rubin с нуля, нацеленного на максимизацию производительности на уровне кластера и соотношение производительности к стоимости.

05

Инновационный дизайн

выделяет Azure

Архитектура Pod-обмена: для обеспечения быстрого обслуживания серверные поддоны GPU Microsoft Azure (международной версии) были спроектированы для быстрого замещения без необходимости в обширной повторной проводке, что увеличивает время работы.

Слой охлаждения: многочиповые компоненты Rubin с высокой пропускной способностью требуют сложных запасов на охлаждение, но Fairwater уже справляется с этой задачей, избегая дорогих циклов модернизации.

Дизайн следующего поколения по электроснабжению: Vera Rubin NVL72 требует постоянно растущей плотности мощности, в то время как многолетние переработки электроснабжения Microsoft Azure (международной версии) (пересмотр жидкостного охлаждения, расширение CDU и высокоамперные шинные каналы) обеспечивают готовность к немедленному развертыванию.

Модульность AI-суперфабрики: в отличие от других облачных провайдеров, Microsoft строит региональные суперкомпьютеры, а не единые гигантские площадки, что делает запуск новых SKU в глобальном масштабе более контролируемым.

06

Преобразование совместного дизайна

в пользу пользователей

Платформа NVIDIA Rubin знаменует собой важный шаг вперед в ускоренных вычислениях, и AI-центры обработки данных и суперфабрики Microsoft Azure (международной версии) завершили проектирование, способное в полной мере использовать это преимущество.

Многолетнее совместное проектирование с NVIDIA в области сетей, систем памяти, охлаждения, упаковки и архитектуры настенных стоек означает, что NVIDIA Rubin может быть интегрирована в платформу Microsoft Azure (международной версии) без необходимости переработки. Основные предпосылки NVIDIA Rubin также были отражены в наших принципах проектирования сетей, электроснабжения, охлаждения, оркестрации и Pod-обмена. Это согласованное сотрудничество приносит немедленную пользу клиентам, позволяя им быстрее развертывать, быстрее масштабироваться и быстрее оказывать влияние на создание следующей эпохи масштабного AI.

Все материалы, публикуемые под этой учетной записью, являются оригинальными работами Microsoft или опубликованы с разрешения правообладателя. Без разрешения любая организация или физическое лицо не имеет права копировать, распространять, транслировать, адаптировать, переводить или собирать эти материалы.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить