Fondateur de SemiAnalysis : Le marché de l'inférence IA pourrait dépasser le pétrole, devenant l'un des plus grands marchés mondiaux.

Le 1er juillet, Dylan Patel, fondateur de SemiAnalysis, a déclaré lors d'un entretien avec le podcast « Training Data » de Sequoia Capital que l'inférence IA deviendra l'un des plus grands marchés mondiaux, potentiellement supérieur au pétrole et représentant plusieurs points de pourcentage du PIB mondial. Il estime que le nombre et la valeur des tâches accomplies après chaque itération de modèle continuent de croître à un rythme plus rapide que celui de la puissance de calcul, suggérant qu'une pénurie de puissance de calcul pourrait persister à long terme. Patel prédit que d'ici 2030, la demande combinée en puissance de calcul de seulement OpenAI et Anthropic dépassera les 100 gigawatts ; dans les 3 à 5 prochaines années, l'impact des centres de données spatiaux restera négligeable, mais d'ici 2040, plus de la moitié de la nouvelle puissance de calcul pourrait être déployée dans l'espace. Il a indiqué que la contrainte centrale réside dans le coût de l'énergie terrestre et la capacité à produire de l'électricité. Une fois que l'économie du déploiement spatial dépassera celle des systèmes terrestres, la migration de la puissance de calcul vers l'espace deviendra inévitable. Concernant la conception collaborative du matériel et du logiciel, Patel a noté que l'augmentation de l'efficacité de l'IA au cours des trois dernières années ne provient pas principalement du matériel, mais plutôt de l'optimisation collaborative au niveau des modèles et entre les couches. Il a cité DeepSeek comme exemple, affirmant que la forme de son modèle d'expert est spécifiquement optimisée pour l'architecture Hopper de NVIDIA, ce qui donne d'excellentes performances sur Hopper mais de mauvaises performances sur TPU ; le modèle d'Anthropic est mieux adapté au TPU, tandis que le modèle d'OpenAI penche vers la voie GPU. Il estime que le prétendu fossé CUDA ne concerne pas seulement CUDA lui-même, mais plutôt l'écosystème de modèles open source qui s'optimise généralement autour de la collaboration GPU. Patel a également mentionné que le fort soutien de Jensen Huang, PDG de NVIDIA, aux entreprises de cloud computing émergentes vise à empêcher les grands fournisseurs de cloud de monopoliser le paysage de la puissance de calcul et à promouvoir un marché multipolaire. De plus, le système de benchmarking d'inférence en temps réel InferenceX construit par l'équipe de SemiAnalysis montre qu'à qualité équivalente, les coûts d'inférence ont diminué d'environ 60 fois par an, et l'intelligence par watt s'est améliorée d'environ 40 fois.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé