Google Cloud A4X Max裸金属实例支持5万GPU集群,网络带宽翻倍

robot
Генерация тезисов в процессе
ME News Новости, 19 апреля (UTC+8), Google Cloud объявила, что их экземпляр A4X Max Bare Metal поддерживает кластер из до 50 000 GPU, пропускная способность сети в два раза выше, чем у предыдущих продуктов. Этот экземпляр принадлежит серии оптимизированных машин Google Compute Engine для ускорителей, которая предварительно оснащена GPU NVIDIA, специально разработанной для ИИ, машинного обучения, высокопроизводительных вычислений и графически интенсивных приложений. В документации подробно описаны несколько серий машин, включая A4X Max, A4X, A4, A3, A2, G4 и G2, а также рекомендации по выбору серии в зависимости от типа рабочей нагрузки (например, предварительная тренировка, тонкая настройка, вывод, графика, высокопроизводительные вычисления). Кроме того, в документации указаны варианты ценообразования и потребления на основе предустановленных GPU, vCPU, памяти и локальных SSD (по требованию, Spot, Flex-start, зарезервированные), а также опыт обслуживания различных типов машин. (Источник: InFoQ)
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 9
  • 2
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
AirdropsAfterTheTideRecedes
· 1ч назад
Облачные провайдеры с ума сходят, кластер из 50 000 GPU — зачем это, тренировать AGI?
Посмотреть ОригиналОтветить0
NoMoreRugs
· 9ч назад
Локальные цены на SSD наконец-то стали более прозрачными, раньше их скрывали глубоко
Посмотреть ОригиналОтветить0
ZkSketcher
· 9ч назад
От серии G2 до A4X — полный охват, и малый и средний бизнес тоже сможет присоединиться.
Посмотреть ОригиналОтветить0
GateUser-6fd3205e
· 9ч назад
Использование экземпляров Spot для обучения ИИ? Остановился один раз — начинай сначала, утомительно
Посмотреть ОригиналОтветить0
ChecksumSmile
· 9ч назад
Предварительно обученная рекомендация A4X, для вывода используется G2, такое разделение довольно тонкое.
Посмотреть ОригиналОтветить0
FeeTaker
· 9ч назад
Flex-start — что это за новинка, гибрид по требованию и резервированию?
Посмотреть ОригиналОтветить0
RugProofRita
· 9ч назад
Масштабирование кластера из 50 000 узлов: сможет ли Kubernetes справиться?
Посмотреть ОригиналОтветить0
MistValleyFront
· 9ч назад
Google Cloud явно нацелена на конкуренцию с AWS Trainium.
Посмотреть ОригиналОтветить0
DaoBackbencher
· 9ч назад
Поддержание различий в опыте — это очень тонко, означает ли это, что некоторые могут взорваться?
Посмотреть ОригиналОтветить0
Подробнее
  • Закреплено