Les cartes communes des investisseurs providentiels : la liste des dix principaux goulots d'étranglement dans les semi-conducteurs



1. Interconnexion (interconnexion cuivre électrique)
Le point faible immédiat limitant l'efficacité des grappes. Les câbles en cuivre à haute vitesse comme NVLink sont encore acceptables sur de courtes distances (dans un rack), mais à mesure que la vitesse de transmission approche 112 Gbps PAM4, l'effet de peau et la diaphonie dans le cuivre provoquent une atténuation rapide du signal, réduisant la distance de transmission efficace à moins d’un mètre. Cela signifie que la topologie physique des grappes GPU est « verrouillée », et l’expansion à grande échelle fait face à une résistance série série.

2. Photonique (interconnexion optique)
Une alternative physique au câble en cuivre. Les signaux optiques ont des avantages significatifs en termes de consommation d’énergie et de densité de bande passante sur de longues distances (entre racks, entre centres de données), mais le goulot d’étranglement actuel réside dans la conversion optoélectronique (O-E-O) — la conversion du signal électrique en signal optique nécessite des lasers, des modulateurs et des détecteurs, dont la fabrication et l’intégration à base de semi-conducteurs III-V sont beaucoup moins matures que le CMOS, avec une capacité de production très lente.

3. EDA (Automatisation de la conception électronique)
Un outil de cartographie de la complexité des puces. Pour les processus en dessous de 3 nm, l’EDA doit traiter la modélisation des effets quantiques et les déviations de processus aléatoires — la charge de calcul passe d’un carré à une exponentielle. La domination du marché mondial par deux géants repose essentiellement sur des barrières écologiques à long terme liées aux bases de données et aux bibliothèques de processus, rendant très difficile la percée des startups, ce qui ralentit la vitesse d’itération des outils par rapport aux besoins de conception des puces.

4. Emballage avancé (CoWoS/EMIB)
Plateforme d’assemblage physique des puces de calcul. Le goulot d’étranglement ne réside pas dans la technologie, mais dans la capacité de production de la couche intermédiaire en silicium (Interposer). La fabrication de cette couche nécessite des wafers en processus mature (65 nm), qui sont depuis longtemps occupés par des capteurs d’image CMOS et d’autres puces matures. La période d’expansion peut durer 12 à 18 mois, ce qui entraîne directement un « chipless » et un « bridge-less » pour GPU et HBM.

5. Conversion de puissance (Module de régulation de tension)
La « couche de traduction » entre le réseau électrique et la puce. La tension alternative haute tension du réseau doit être convertie en environ 1V en courant continu via plusieurs étapes de conversion DC-DC. Les MOSFET en silicium traditionnels ont une perte de commutation très élevée sous de faibles tensions et de forts courants, avec une efficacité limitée à 90%-92%. Dans les centres de données de centaines de mégawatts, chaque augmentation de 1% d’efficacité permet d’économiser des dizaines de millions de kWh par an, mais la capacité de production des dispositifs SiC/GaN est gravement limitée par la taille et la qualité des substrats.

6. Dissipation thermique (refroidissement liquide)
Une contrainte rigide du second principe de la thermodynamique. La limite du refroidissement par air est d’environ 50 W/cm², alors que la chaleur locale du chip B200 de Nvidia dépasse déjà 100 W/cm². Le refroidissement liquide se tourne vers l’immersion ou les plaques froides, mais le goulot d’étranglement réside dans la performance diélectrique du liquide de refroidissement et la fiabilité de l’étanchéité des conduits — la rénovation des centres de données implique des travaux de génie civil et des normes de sécurité incendie, avec des cycles de déploiement très longs.

7. Nouveaux matériaux (substituts de substrats)
Tentatives de révolutionner les propriétés physiques sous-jacentes. Ce n’est pas un domaine unique, mais une percée multi-points face aux goulots d’étranglement mentionnés : GaN/SiC pour la conversion de puissance, InP pour la photonique, diamants synthétiques (avec une conductivité thermique 5 fois supérieure à celle du cuivre) pour le refroidissement des emballages, substrats en verre pour le déformation de grands emballages. Chaque filière matérielle implique des processus de purification longs (comme la déposition en phase vapeur pour les diamants) et une intégration hétérogène complexe (comment associer avec le silicium), ce qui constitue un véritable enfer d’ingénierie.

8. Mémoire (HBM/DRAM/NAND)
Les « vaisseaux sanguins » alimentant la puissance de calcul. La HBM dépend des TSV (trous traversants en silicium) et de l’empilement de micro-bumps, avec un rendement bien inférieur à celui de la DRAM ordinaire. De plus, la formation de modèles d’IA passe d’une pénurie de HBM à un débordement de la bande passante DRAM et de la capacité SSD, ce qui signifie que la capacité de production de tout le système de stockage (notamment la cadence d’investissement des fabricants sud-coréens) ne peut suivre la croissance exponentielle du nombre de paramètres des grands modèles.

9. Gaz hélium
Le « sang » des usines de wafers. La lithographie, l’etching, la déposition en phase vapeur nécessitent de l’hélium de haute pureté comme gaz porteur ou comme liquide de refroidissement. L’hélium provient du gaz associé au gaz naturel, avec plus de 90 % provenant des États-Unis, du Qatar et de la Russie, et il est non renouvelable. La rupture d’approvisionnement affecte non seulement les processus avancés, mais aussi le taux de rendement des wafers en processus mature, avec des baisses brutales.

10. Électricité
Le plafond absolu de tout ce qui précède. L’expansion du réseau électrique implique des transformateurs, des corridors de transmission haute tension et des approbations de raccordement, avec un cycle généralement de 3 à 5 ans. La fluctuation instantanée de la consommation dans les grappes d’IA (par exemple lors de la mise à jour synchronisée des gradients en entraînement) pose un défi majeur à la capacité de régulation du réseau. Sans capacité électrique redondante, même si les puces, l’emballage et le refroidissement liquide sont en place, les racks ne peuvent pas être alimentés.
Voir l'original
post-image
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire