OpenAI s'associe à Broadcom pour lancer la première puce AI « Jalapeño », en 9 mois, une arrivée rapide pour défier la domination de Nvidia

OpenAI et Broadcom ont officiellement dévoilé le 24 le premier processeur AI personnalisé « Jalapeño ».
Cette puce, conçue pour l'inférence de grands modèles de langage (LLM), a été développée en seulement 9 mois, de la conception à la production en série, et devrait commencer à être déployée d'ici la fin 2026.
Ce lancement marque une étape clé pour OpenAI vers une « plateforme complète », visant à améliorer l'efficacité par watt et à réduire la dépendance excessive à NVIDIA.
(Précédent contexte : OpenAI Codex aurait tué votre SSD : 37 TB écrits en 21 jours, la durée de vie du disque dur consommée en moins d’un an)
(Contexte supplémentaire : OpenAI annonce le plan « Réparer la Terre », fournissant une assistance en sécurité pour 19 projets open source renommés tels que cURL, Python, PyPI)

Le géant de l'intelligence artificielle, OpenAI, entre officiellement dans le domaine du matériel, visant l'autonomie des puces.
Le 24 juin 2026, OpenAI et le géant des puces de communication Broadcom ont présenté conjointement à San Francisco et Palo Alto le premier processeur intelligent nommé « Jalapeño ».
Ce accélérateur AI, spécialement conçu pour l'inférence de futurs grands modèles de langage (LLM), marque la transition d'OpenAI de produits et modèles vers le niveau fondamental des puces, accomplissant une étape importante vers la « création d'une pile complète (Full stack) ».

Lors de la cérémonie de lancement, le président-directeur général de Broadcom, Hock Tan, a personnellement remis un échantillon de Jalapeño au PDG d'OpenAI, Sam Altman, et au président Greg Brockman, annonçant le lancement officiel de l'écosystème matériel en collaboration.

9 mois pour une arrivée express, ciblant la performance en inférence LLM

Jalapeño est une puce spécifique (ASIC), conçue entièrement à partir de zéro, adaptée aux besoins modernes d'inférence LLM, et non une version modifiée d’un accélérateur généraliste.
Grâce à la collaboration entre l'équipe d'ingénierie d'OpenAI, l'expertise en réalisation de silicium de Broadcom, et l'accélération par leurs propres modèles AI, cette puce a été conçue et envoyée en fabrication (Tape-out) en un temps record de seulement 9 mois.

Actuellement, des prototypes en laboratoire fonctionnent avec succès à la fréquence et à la consommation ciblées, traitant des charges de travail d'apprentissage automatique incluant GPT-5.3-Codex-Spark.
Les premiers tests indiquent une « performance par watt » nettement supérieure aux standards de pointe du marché.
Le responsable du projet matériel d’OpenAI, Richard Ho, souligne que l’équipe a optimisé en profondeur la gestion de la mémoire, le réseau et les modes de service pour les modèles AI de pointe, permettant une utilisation plus proche du pic théorique.

Réduire la dépendance à NVIDIA, déploiement en gigawatts d’ici fin 2026

Depuis la vague de l’IA générative lancée en 2022, OpenAI a été l’un des plus grands acheteurs de GPU NVIDIA.
Cependant, face à la croissance explosive des besoins en puissance de calcul, la diversification des sources de puces devient une priorité.
En plus de lancer leur propre puce Jalapeño, OpenAI collabore également avec Amazon AWS (utilisant la puce Trainium), AMD, et Cerebras pour réduire la dépendance à un seul fournisseur et maîtriser les coûts.

Broadcom, bénéficiaire majeur de la vague de l’IA générative, a été responsable de la fabrication de Jalapeño et de son intégration réseau (incluant le silicium Tomahawk), tandis que Celestica s’occupe de l’intégration des cartes et des systèmes rack.
Cette puce devrait commencer à être déployée d’ici la fin 2026, avec des partenaires comme Microsoft, pour une expansion multi-générationnelle à l’échelle gigawatt.

Greg Brockman, président d’OpenAI, déclare que le monde se dirige vers une « économie pilotée par le calcul », et qu’en concevant davantage de couches fondamentales, OpenAI pourra fournir des services intelligents avec une efficacité accrue.
Alors que les géants technologiques investissent massivement dans la conception de leurs propres puces, le marché de la puissance AI est en pleine recomposition sans précédent.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire