Le laboratoire de puces AWS d'Amazon situé à Austin développe ses puces Trainium pour l'IA. La dernière puce Trainium3, à performance équivalente, réduit les coûts de jusqu'à 50% par rapport aux serveurs cloud traditionnels. Ces puces sont maintenant également optimisées pour l'inférence IA, soutenant des services tels qu'Amazon Bedrock, et prennent en charge les principaux modèles d'IA, notamment Anthropic Claude, qui s'exécutent désormais sur plus de 1 million de puces Trainium2. Amazon a récemment conclu un accord avec OpenAI pour fournir une capacité Trainium de 2 gigawatts. L'équipe du laboratoire se concentre sur le "lancement" et la conception rapides des puces, visant à fournir une alternative économique pour contrecarrer les GPU dominants d'NVIDIA.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler