CITIC Securities : La capacité de stockage s'améliore pour répondre aux besoins fondamentaux de la déduction dans l'intelligence actuelle

robot
Création du résumé en cours

Chaque actualité AI Express, un rapport de CITIC Securities indique que l’IA évolue de « simples conversations » vers des « agents (Agent) » intelligents, entraînant une explosion de la longueur de contexte. D’après les données de Epoch AI, la fenêtre de contexte la plus longue augmente d’environ 30x chaque année, et il existe une relation linéaire entre la capacité de mémoire vidéo du KV Cache et la longueur de contexte, largement supérieure à la cadence d’amélioration des configurations matérielles. À l’heure actuelle, les principaux fournisseurs de grands modèles et les fabricants de matériel résolvent principalement le goulot d’étranglement de la puissance de calcul par la quantification, le stockage hiérarchisé et l’optimisation de l’architecture des modèles, mais cela ne change toujours pas l’exigence en mémoire vidéo face à l’explosion de la demande. CITIC Securities estime que l’optimisation de la mémoire vidéo pourrait réduire le coût de génération par Token, puis stimuler les utilisateurs à activer une plus forte concurrence et des contextes plus longs ; la demande totale en puissance de calcul ne diminuera pas et augmentera au contraire. La mise à niveau de la puissance de calcul deviendra un besoin central pour l’inférence des agents à l’heure actuelle, et le scénario de croissance du stockage est fermement optimiste.

Actualité quotidienne économique

(Rédacteur :董萍萍 )

     【Avertissement】Le présent article ne reflète que les opinions de l’auteur et n’est lié en rien à Hexun. Le site Hexun maintient une position neutre concernant les déclarations, opinions et jugements contenus dans l’article, et n’offre aucune garantie expresse ou implicite quant à l’exactitude, la fiabilité ou l’exhaustivité de tout contenu. Veuillez lire le présent article uniquement à titre de référence et assumer l’entière responsabilité qui en découle. Courriel:news_center@staff.hexun.com

Signaler

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler