Google Cloud A4X Max підтримує кластер з 50 000 GPU на голому металевому інстансі, пропускна здатність мережі подвоєна

robot
Генерація анотацій у процесі
ME News Новини, 19 квітня (UTC+8), Google Cloud оголосила, що її інстанція A4X Max для голого металу підтримує кластер до 50 000 GPU, пропускна здатність мережі вдвічі більша за попередні моделі. Цей інстанс належить до серії оптимізованих машин Google Compute Engine для прискорювачів, яка попередньо оснащена GPU NVIDIA, спеціально розроблених для AI, машинного навчання, високопродуктивних обчислень та графічних додатків. Документація детально описує кілька серій машин, включаючи A4X Max, A4X, A4, A3, A2, G4 і G2, а також рекомендує відповідні серії залежно від типу навантаження (наприклад, попереднє навчання, тонке налаштування, інференс, графіка, високопродуктивні обчислення). Крім того, у документації наведено цінові та споживчі опції на основі попередньо встановлених GPU, vCPU, пам’яті та локальних SSD (з оплатою за потребою, Spot, Flex-start, зарезервовані), а також досвід обслуговування різних типів машин. (Джерело: InFoQ)
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 9
  • 2
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
AirdropsAfterTheTideRecedes
· 55хв. тому
Хмарні провайдери божеволіють, 50 000 GPU-кластер — навіщо це, тренують AGI?
Переглянути оригіналвідповісти на0
NoMoreRugs
· 9год тому
Ціни на локальні SSD нарешті стали більш прозорими, раніше їх приховували глибоко
Переглянути оригіналвідповісти на0
ZkSketcher
· 9год тому
Від G2 до повної серії A4X — навіть малі та середні підприємства можуть приєднатися.
Переглянути оригіналвідповісти на0
GateUser-6fd3205e
· 9год тому
Spot інстанси для тренування AI? Перерва — і знову з початку, втомлює.
Переглянути оригіналвідповісти на0
ChecksumSmile
· 9год тому
Передтренована рекомендація A4X, для висновків використовується G2, ця розподіл досить детальний
Переглянути оригіналвідповісти на0
FeeTaker
· 9год тому
Flex-start — що це за новий фокус, гібрид між за потребою та резервуванням?
Переглянути оригіналвідповісти на0
RugProofRita
· 9год тому
Часова складність розподілу кластера з 50 000 карток, чи зможе Kubernetes витримати?
Переглянути оригіналвідповісти на0
MistValleyFront
· 9год тому
Google Cloud цим чином явно націлений на конкуренцію з AWS Trainium
Переглянути оригіналвідповісти на0
DaoBackbencher
· 9год тому
Підтримка різниць у досвіді — це дуже тонко, чи означає це, що деякі з них вибухнуть?
Переглянути оригіналвідповісти на0
Дізнатися більше
  • Закріплено