NVIDIA, AWS lancent une infrastructure d'IA pour une échelle de production

Terrill Dicki

24 juin 2026 00:18

NVIDIA et AWS dévoilent des outils d'IA pour rationaliser les déploiements à l'échelle de l'entreprise, en tirant parti des nouvelles instances EC2 G7 et de la recherche vectorielle accélérée par GPU dans OpenSearch.

NVIDIA (NASDAQ : NVDA) et Amazon Web Services (AWS) approfondissent leur collaboration pour rendre le déploiement de l'IA à l'échelle de la production plus accessible aux entreprises. Le partenariat introduit de nouveaux outils, notamment des instances EC2 G7 alimentées par les GPU RTX PRO 4500 de NVIDIA et une recherche vectorielle accélérée par GPU dans Amazon OpenSearch Serverless. Ces avancées visent à réduire la complexité opérationnelle tout en offrant des capacités d'IA haute performance.

Les instances EC2 G7 représentent une avancée significative. Par rapport à la génération G6 précédente, G7 offre jusqu'à 4,6 fois d'amélioration des performances d'inférence IA et 2,1 fois de traitement graphique plus rapide. Avec jusqu'à huit GPU par instance, 256 Go de mémoire GPU et une connectivité réseau de 700 Gbps, ces configurations sont conçues pour des charges de travail exigeantes, allant de l'inférence IA à grande échelle au traitement de médias haute résolution. Elles sont également faciles à intégrer via des outils AWS comme SageMaker, EMR et EKS.

Du côté de la récupération, la nouvelle bibliothèque cuVS de NVIDIA rend la indexation vectorielle alimentée par GPU la norme dans Amazon OpenSearch Serverless. Cette amélioration offre jusqu'à 10 fois de performances de recherche vectorielle plus rapide pour un coût réduit d'un quart par rapport aux systèmes basés sur CPU. Pour les entreprises développant des applications telles que la recherche sémantique ou les moteurs de recommandation, ces améliorations se traduisent par un déploiement plus rapide et des économies de coûts significatives.

NVIDIA renforce son leadership en IA

Ce partenariat avec AWS renforce l'évolution de NVIDIA en tant que fournisseur d'infrastructure IA complet. Au 23 juin 2026, la capitalisation boursière de NVIDIA s'élève à 4,88 trillions de dollars, reflétant sa domination dans l'informatique accélérée. Des jalons récents, comme la commercialisation de la plateforme Vera Rubin et l'annonce du 22 juin de 35 nouveaux supercalculateurs IA en Europe, témoignent des ambitions plus larges de l'entreprise au-delà des GPU.

En plus du matériel, NVIDIA s'engage dans l'orchestration logicielle de l'IA. Son système d'exploitation d'inférence Dynamo 1.0, lancé plus tôt cette année, est désormais intégré par de grands fournisseurs de cloud, dont AWS. Cela complète les nouvelles offres AWS, créant une voie plus fluide pour que les entreprises opérationnalisent leurs charges de travail IA.

Implications pour le marché

Pour AWS, obtenir le statut de Cloud Exemplaire de NVIDIA pour la plateforme GB300 renforce sa position en tant que fournisseur de premier plan pour les charges de travail de formation IA. Cette certification garantit aux clients des performances cohérentes et optimisées pour la formation de modèles à grande échelle, réduisant ainsi l'incertitude dans le choix du fournisseur cloud.

Pour NVIDIA, ces avancées constituent une étape supplémentaire dans sa transformation d'un fabricant de GPU à un leader intégré verticalement dans l'infrastructure IA. Les partenariats étroits de l'entreprise avec des acteurs majeurs comme AWS et l'innovation continue dans le matériel et le logiciel IA la positionnent comme un pivot dans l'industrie de l'IA.

Les investisseurs pourraient voir ces développements comme prometteurs, surtout alors que NVIDIA continue d'étendre sa présence dans le supercalcul IA et le logiciel. Avec une action cotée à 200,04 dollars au 23 juin 2026, la capacité de l'entreprise à maintenir sa trajectoire de croissance dépend de l'adoption réussie de ses solutions d'infrastructure IA par des partenaires comme AWS.

Les entreprises cherchant à augmenter leur production d'IA trouveront les dernières offres de NVIDIA et AWS convaincantes, avec la promesse de coûts réduits, d'un déploiement plus rapide et d'une surcharge opérationnelle moindre. À mesure que ces outils seront plus largement disponibles — certains dès la fin de cette année — leur impact sur le marché de l'infrastructure IA mérite d'être suivi.

Source de l'image : Shutterstock

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire