OpenAI dévoile sa première puce Jalapeño : tape-out en 9 mois, prévoit un déploiement de niveau gigawatt d'ici fin 2026

Selon la surveillance de Beating, OpenAI a lancé sa première puce, Jalapeño, spécialement conçue pour accélérer l’inférence dans les grands modèles de langage (LLM). OpenAI est responsable de l’architecture et de la conception algorithmique de la puce, en collaboration avec Broadcom et Celestica pour faire progresser la production à l’échelle industrielle. Jalapeño vise à améliorer directement la vitesse de performance et à réduire les coûts de calcul pour ChatGPT, Codex, les interfaces API et les futurs produits d’agents intelligents. Grâce aux modèles d’IA de pointe d’OpenAI qui ont assisté la conception, Jalapeño a atteint le tape-out seulement 9 mois après sa conception initiale, établissant un record pour le développement le plus rapide d’un circuit intégré spécifique à une application (ASIC). La puce utilise une co-conception d’algorithmes et de matériel, se restructurant autour d’un cœur dédié aux grands modèles de langage, au déplacement des données et à l’architecture réseau, atteignant des taux d’utilisation pratiques proches des limites théoriques du matériel. Les premiers échantillons d’ingénierie ont exécuté avec succès des charges de travail telles que GPT-5.3-Codex-Spark sous la fréquence cible et la consommation électrique en laboratoire, les premiers tests montrant des améliorations significatives de l’efficacité énergétique par rapport aux dispositifs informatiques de premier plan existants. Dans la chaîne d’approvisionnement technologique, Broadcom est principalement responsable de la mise en œuvre du silicium et de la connectivité réseau de Jalapeño, intégrant la puce Tomahawk, tandis que Celestica fournit un support pour l’intégration des cartes, des racks et des systèmes. En tant que premier produit d’une feuille de route de plateforme de calcul multi-générationnelle, Jalapeño devrait être déployé à grande échelle dans des centres de données super-larges de niveau gigawatt en collaboration avec des partenaires comme Microsoft d’ici la fin 2026, visant à étendre les capacités de la plateforme full-stack et à réduire les coûts d’inférence.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire