Fondateur de SemiAnalysis : le marché de l'inférence IA pourrait dépasser le pétrole, devenant l'un des plus grands marchés mondiaux.

Le 1er juillet, Dylan Patel, fondateur de SemiAnalysis, a déclaré dans une interview au podcast "Training Data" de Sequoia Capital que l'inférence IA deviendra l'un des plus grands marchés mondiaux, dépassant potentiellement le pétrole et représentant plusieurs points de pourcentage du PIB mondial. Il estime que le nombre et la valeur des tâches accomplies après chaque itération de modèle continuent de croître à un rythme plus rapide que l'augmentation de la puissance de calcul, suggérant qu'une pénurie de puissance de calcul pourrait persister à long terme. Patel prédit que d'ici 2030, la demande combinée de puissance de calcul de seulement OpenAI et Anthropic dépassera 100 gigawatts ; dans les 3 à 5 prochaines années, l'impact des centres de données spatiaux restera négligeable, mais d'ici 2040, plus de la moitié des nouvelles capacités de calcul pourraient être déployées dans l'espace. Il a indiqué que la contrainte principale réside dans le coût de l'énergie terrestre et la capacité à produire de l'électricité. Une fois que l'économie du déploiement spatial surpassera celle des systèmes terrestres, la migration du calcul vers l'espace deviendra inévitable. Concernant la conception collaborative du matériel et du logiciel, Patel a noté que l'augmentation de l'efficacité de l'IA au cours des trois dernières années ne provient pas principalement du matériel, mais plutôt de l'optimisation au niveau du modèle et de la collaboration entre couches. Il a cité DeepSeek comme exemple, indiquant que la forme de son modèle expert est spécifiquement optimisée pour l'architecture Hopper de NVIDIA, ce qui donne d'excellentes performances sur Hopper mais de mauvaises performances sur TPU ; le modèle d'Anthropic est plus adapté au TPU, tandis que celui d'OpenAI penche vers la voie GPU. Il estime que le soi-disant fossé CUDA ne concerne pas seulement CUDA lui-même, mais plutôt l'écosystème de modèles open source qui s'optimise généralement autour de la collaboration GPU. Patel a également mentionné que le soutien fort du PDG de NVIDIA, Jensen Huang, aux entreprises de cloud computing émergentes vise à empêcher les grands fournisseurs de cloud de monopoliser le paysage du calcul et à promouvoir un marché multipolaire. De plus, le système d'évaluation comparative de l'inférence en temps réel InferenceX, construit par l'équipe SemiAnalysis, montre qu'à qualité équivalente, les coûts d'inférence ont diminué d'environ 60 fois par an, et l'intelligence par watt s'est améliorée d'environ 40 fois.
DEEPSEEK-0,85%
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé