ME News Actualités, le 19 avril (UTC+8), Google Cloud a annoncé que son instance nue A4X Max peut prendre en charge un cluster pouvant atteindre 50 000 GPU, avec une bande passante réseau deux fois supérieure à celle des produits précédents.
Cette instance appartient à la série d'optimisation des machines Google Compute Engine pour accélérateurs, qui sont préinstallées avec des GPU NVIDIA, conçues pour l'IA, l'apprentissage automatique, le calcul haute performance et les applications graphiques intensives.
La documentation décrit en détail plusieurs séries de machines, y compris A4X Max, A4X, A4, A3, A2, G4 et G2, et recommande des séries spécifiques en fonction du type de charge de travail (comme pré-entraînement, ajustement fin, inférence, graphique, calcul haute performance).
De plus, la documentation explique également les options de tarification et de consommation basées sur des GPU préinstallés, vCPU, mémoire et SSD local (à la demande, Spot, Flex-start, réservé), ainsi que l'expérience de maintenance pour différents types de machines.
(Source : InFoQ)

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

7 J'aime

Récompense
7
8
2
Partager

Commentaire

Ajouter un commentaire

NoMoreRugs

· Il y a 3h

Le prix des SSD locaux est enfin un peu plus transparent, il était auparavant bien caché.

Voir l'originalRépondre0

ZkSketcher

· Il y a 3h

De G2 à toute la série A4X, la couverture est complète, même les petites et moyennes entreprises peuvent en profiter un peu.

Voir l'originalRépondre0

GateUser-6fd3205e

· Il y a 3h

Lancer une formation AI avec une instance Spot ? Interrompre une fois et recommencer depuis le début, c'est épuisant

Voir l'originalRépondre0

ChecksumSmile

· Il y a 3h

Pré-entraînement recommandé A4X, utilisation de G2 pour l'inférence, cette division est assez fine.

Voir l'originalRépondre0

FeeTaker

· Il y a 3h

Flex-start, c'est quoi cette nouvelle tendance, un mélange entre le sur-mesure et la réservation ?

Voir l'originalRépondre0

RugProofRita

· Il y a 3h

La complexité de la planification d’un cluster de 50 000 cartes, Kubernetes peut-il la supporter ?

Voir l'originalRépondre0

MistValleyFront

· Il y a 3h

Google Cloud cette fois-ci vise clairement AWS Trainium

Voir l'originalRépondre0

DaoBackbencher

· Il y a 3h

La phrase « maintenir la différence d'expérience » est très subtile, cela signifie-t-il que certains vont échouer ?

Voir l'originalRépondre0

Sujets populaires
Afficher plus
#
WinGoldBarsWithGrowthPoints
1.25M Popularité
#
WTICrudeFallsBelow90Dollars
1.21M Popularité
#
IsraelStrikesIranBTCPlunges
51.65K Popularité
#
StockTradingChallengeUpTo17000U
211.9K Popularité
#
USIranNegotiationGame
9.36M Popularité

Épinglé

Google Cloud A4X Max instance en métal nu supporte un cluster de 50 000 GPU, la bande passante réseau double

Sujets populaires

WinGoldBarsWithGrowthPoints

WTICrudeFallsBelow90Dollars

IsraelStrikesIranBTCPlunges

StockTradingChallengeUpTo17000U

USIranNegotiationGame

Épinglé