La puissance de calcul GPU poussée à son maximum, mais bute sur la bande passante mémoire — ce point de vue de Jukan est plutôt contre-intuitif, mais en y réfléchissant, c'est vrai : la position de HBM dans le monde mérite d'être revue.

Voir l'original
CoinNetwork
Nouvelles de BitzWorld, Jukan, analyste chez Citrini Research, a déclaré que l'amélioration des performances d'inférence des modèles d'IA ne se fait pas seulement en ajoutant des GPU Nvidia. En raison des goulots d'étranglement de mémoire, les GPU sont souvent inactifs avec une faible utilisation lors de l'inférence. Le retour sur investissement de l'inférence dépend de la mémoire plutôt que du GPU, et l'importance de Micron pourrait surpasser celle de Nvidia.
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé