xAI possède 500 000 GPU mais leur taux d'utilisation n'est que de 11 %

robot
Création du résumé en cours

CoinWorld消息,马斯克旗下的xAI拥有约50万张英伟达GPU,公开数据中属于AI开发商里最大的集群之一。但内部备忘录显示,xAI近几周的MFU(模型浮点运算利用率,衡量芯片实际算力产出占理论峰值的比例)仅约11%。一名竞争对手实验室的研究员称,大多数公司要突破40%都很难,但11%「低得离谱」。利用率低是行业通病,AI训练是间歇式的:GPU在训练时满负荷运转,研究员分析结果、决定下一步时芯片就闲着了。硬件层面也有瓶颈:高带宽内存(HBM)速度跟不上计算芯片,成千上万张GPU之间传输数据时网络任何薄弱环节都会拖慢整个集群。行业内还有「刷数据」现象,一家大型实验室的研究员透露,同事会反复重跑训练实验来抬高利用率数字,一方面避免被上级批评,另一方面防止闲置的GPU被调给其他团队。

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler