Google Cloud A4X Max instance en métal nu supporte un cluster de 50 000 GPU, la bande passante réseau double

robot
Création du résumé en cours
ME News Actualités, le 19 avril (UTC+8), Google Cloud a annoncé que son instance nue A4X Max peut prendre en charge un cluster pouvant atteindre 50 000 GPU, avec une bande passante réseau deux fois supérieure à celle des produits précédents.
Cette instance appartient à la série d'optimisation des machines Google Compute Engine pour accélérateurs, qui sont préinstallées avec des GPU NVIDIA, conçues pour l'IA, l'apprentissage automatique, le calcul haute performance et les applications graphiques intensives.
La documentation décrit en détail plusieurs séries de machines, y compris A4X Max, A4X, A4, A3, A2, G4 et G2, et recommande des séries spécifiques en fonction du type de charge de travail (comme pré-entraînement, ajustement fin, inférence, graphique, calcul haute performance).
De plus, la documentation explique également les options de tarification et de consommation basées sur des GPU préinstallés, vCPU, mémoire et SSD local (à la demande, Spot, Flex-start, réservé), ainsi que l'expérience de maintenance pour différents types de machines.
(Source : InFoQ)
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 8
  • 2
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
NoMoreRugs
· Il y a 3h
Le prix des SSD locaux est enfin un peu plus transparent, il était auparavant bien caché.
Voir l'originalRépondre0
ZkSketcher
· Il y a 3h
De G2 à toute la série A4X, la couverture est complète, même les petites et moyennes entreprises peuvent en profiter un peu.
Voir l'originalRépondre0
GateUser-6fd3205e
· Il y a 3h
Lancer une formation AI avec une instance Spot ? Interrompre une fois et recommencer depuis le début, c'est épuisant
Voir l'originalRépondre0
ChecksumSmile
· Il y a 3h
Pré-entraînement recommandé A4X, utilisation de G2 pour l'inférence, cette division est assez fine.
Voir l'originalRépondre0
FeeTaker
· Il y a 3h
Flex-start, c'est quoi cette nouvelle tendance, un mélange entre le sur-mesure et la réservation ?
Voir l'originalRépondre0
RugProofRita
· Il y a 3h
La complexité de la planification d’un cluster de 50 000 cartes, Kubernetes peut-il la supporter ?
Voir l'originalRépondre0
MistValleyFront
· Il y a 3h
Google Cloud cette fois-ci vise clairement AWS Trainium
Voir l'originalRépondre0
DaoBackbencher
· Il y a 3h
La phrase « maintenir la différence d'expérience » est très subtile, cela signifie-t-il que certains vont échouer ?
Voir l'originalRépondre0
  • Épinglé