Les opportunités derrière le « ordinateur intelligent » annoncées par Jensen Huang : pas de sortie de données, tokens entièrement gratuits

Au début de ce mois, Jensen Huang, fondateur de Nvidia, a lancé le premier super chip pour PC Windows conçu spécifiquement pour l’agent IA personnel (AI Agent) — le RTX Spark. Cette annonce est considérée comme la transformation la plus révolutionnaire dans l’industrie PC depuis la généralisation de l’interface graphique Windows dans les années 90, Huang allant jusqu’à la qualifier de « refonte et reconstruction complètes du PC pour la première fois en 40 ans ».

　　Il est peut-être prématuré de dire que le PC a été complètement bouleversé, mais il est évident que la définition du PC devient plus flexible. Un professionnel chevronné du secteur a confié à nos reporters que les fabricants de matériel exploitent pleinement l’opportunité de l’IA, avec de nombreuses nouvelles conceptions et un écosystème en pleine vitalité.

Changer l’architecture du PC depuis 40 ans

　　Le RTX Spark n’est pas une « victoire solitaire » de Nvidia, mais le fruit d’une alliance écologique technologique mondiale puissante. Ce chip a été conçu conjointement par Nvidia et MediaTek, fabriqué avec la technologie TSMC en 3 nanomètres, et Microsoft a participé en profondeur à l’optimisation du système.

　　Ce chip n’est pas un CPU ou GPU traditionnel, mais une puce système (SoC) hautement intégrée, dont l’architecture centrale suit le concept de « fusion hétérogène », intégrant plusieurs composants clés initialement dispersés sur la carte mère du PC dans une seule puce. La innovation la plus révolutionnaire réside dans l’architecture mémoire unifiée — alors que les PC traditionnels séparent la mémoire du CPU (processeur central) et la mémoire vidéo du GPU (processeur graphique), nécessitant des transferts de données répétés, ce qui entraîne latence et consommation d’énergie, le RTX Spark permet au CPU et au GPU de partager un pool de mémoire allant jusqu’à 128 Go, avec une bande passante interne maximale de 600 Go/s grâce à la technologie d’interconnexion de seconde génération de Nvidia. Cette conception élimine complètement le goulot d’étranglement des transferts de données, permettant au GPU d’accéder directement à une grande mémoire système, ce qui est crucial pour faire fonctionner des modèles d’IA de très grande taille.

　　Nvidia a fourni des indicateurs de performance pour le RTX Spark dans plusieurs scénarios clés : exécuter localement un grand modèle de langage de 120 milliards de paramètres, supportant 1 million de tokens (unités de texte) de contexte ; faire tourner un jeu AAA en 1440p/100FPS ; éditer en douceur une vidéo 12K 4∶2∶2. Parmi ces capacités, la possibilité d’exécuter localement un modèle de 120 milliards de paramètres est particulièrement importante — l’utilisateur n’a pas besoin de connexion réseau ni de payer pour le cloud, il peut faire fonctionner un grand modèle de langage équivalent à GPT-3.5 sur un ordinateur portable, supportant des livres entiers ou des centaines de pages de documents professionnels dans leur contexte.

De « logiciel d’exploitation » à « expression des besoins »

　　Jensen Huang a évoqué lors de son discours la différence fondamentale entre ordinateur IA et ordinateur traditionnel : « Au cours des 40 dernières années, tout le monde ouvrait une application, cliquait ou tapait des commandes pour faire son travail. Avec RTX Spark, l’utilisateur n’a qu’à exprimer ses besoins, le reste est laissé à l’ordinateur. »

　　Cela implique un changement de conception du PC : autrefois, le PC était conçu autour de « l’humain », mais à l’avenir, il sera conçu pour l’agent IA. Liu Xingliang, économiste numérique, explique que les gens doivent passer de « savoir manipuler » à « savoir exprimer », et que la compétence la plus importante pour un individu pourrait devenir la capacité à poser des questions, juger, créer et décider.

　　Rappelons la vague d’installation et de désinstallation de « Lobster » (OpenClaw) qui a eu lieu presque simultanément il y a peu, dont la raison principale était la facturation imprévisible des tokens et les préoccupations de sécurité. Le déploiement local de grands modèles évite parfaitement ces deux problèmes — un modèle de 120 milliards de paramètres peut fonctionner directement en local, sans sortir de données ni payer de frais.

　　En réalité, dès 2023, des produits PC IA sont apparus sur le marché, mais pourquoi cette année est-elle considérée comme l’année zéro de l’IA PC ? La clé réside dans la volonté de paiement des consommateurs. La puissance de calcul initiale de l’AIPC était seulement de 10 à 40 TOPS (trillions d’opérations par seconde), ne permettant de faire fonctionner que de petits modèles de moins de 7 milliards de paramètres, avec une utilité limitée ; les produits suivants ont augmenté la puissance à 40-60 TOPS, permettant de faire tourner des modèles de 13 à 30 milliards de paramètres, mais l’IA restait comme un plugin. Or, le RTX Spark, conçu dès la conception du chip pour l’agent IA, dispose d’une puissance de calcul IA locale de 1 PetaFLOP (équivalent à 500 TOPS) et supporte des modèles de 120 milliards de paramètres — pour le consommateur moyen, utiliser de grands modèles sur PC est désormais aussi performant que dans le cloud, avec plus de sécurité et sans payer pour les tokens, ce qui renforce considérablement la volonté d’achat.

　　La réaction du marché a été rapide : le jour de la sortie du RTX Spark, le cours de Nvidia a augmenté de 6,26 %, ARM a bondi de 15,73 %, tandis qu’Intel et Qualcomm ont respectivement chuté de 4,67 % et 8,78 %.

Faire tourner un grand modèle « full blood » en local

　　La présentation de Jensen Huang a enthousiasmé une entreprise chinoise de chips appelée Houmo Intelligent. Jusqu’ici, ils peinaient à convaincre le marché d’accepter de déplacer de grands modèles vers le terminal. La conception du RTX Spark correspond parfaitement à leur puce M50, qui partage la même philosophie : celui qui pourra faire tourner un grand modèle « full blood » sur PC aura la capacité de définir toute la règle du jeu dans le domaine de l’AI PC.

　　La méthode de Nvidia consiste à intégrer CPU et GPU dans une seule puce, tandis que Houmo Intelligent M50 est une puce architecture mémoire-calcul intégrée. Leur point commun est l’innovation architecturale qui permet de faire passer la puissance de calcul IA du statut de fonction auxiliaire à celui de capacité principale de la puce.

Lenovo lance le PC AI P7

　　Le mois dernier, Lenovo a lancé le PC AI P7 équipé de la puce Houmo M50, capable de faire tourner en toute fluidité un grand modèle local de jusqu’à 122 milliards de paramètres dans un boîtier aussi petit qu’une paume. Niu Xiaolin, vice-président des ventes de la division PC de Houmo Intelligent, explique que le M50 est une puce efficace conçue pour l’inférence de grands modèles, capable d’atteindre 160 TOPS avec une faible consommation de 10 watts, combinant grande mémoire et haute bande passante, répondant parfaitement aux besoins de déploiement local en termes de faible consommation et de haute performance.

　　Récemment, une « entreprise unipersonnelle » de Shanghai, Liaoqi Intelligent, a collaboré avec Houmo Intelligent pour créer un centre de calcul intelligent personnel supportant l’interaction holographique, capable de gérer l’agenda, de résumer des notes et de dialoguer en tant que coach. Ce produit a été déployé dans une maison de retraite du district de Huangpu, où les personnes âgées peuvent interagir avec leur famille à distance via une image numérique holographique.

Le centre de calcul intelligent personnel holographique créé par Liaoqi Intelligent et Houmo Intelligent.

　　Une société de stockage en réseau (NAS) souhaite également devenir le centre de contrôle familial de la prochaine génération. Elle espère exploiter la capacité de grands modèles intégrée dans le M50 pour mobiliser les données personnelles stockées dans le NAS, afin de jouer un rôle plus important en tant que centre de données personnel.

　　Les données de l’Académie chinoise des technologies de l’information et des communications indiquent qu’au premier trimestre 2026, le taux d’adoption de l’IA PC en Chine atteindra 42 %, avec une croissance annuelle de 380 %. Nous pouvons attendre avec impatience le lancement de l’IA PC qui « changera les règles » cet automne, ou la floraison de divers produits intelligents.

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

2 J'aime

Récompense
2
Commentaire
Reposter
Partager

Commentaire

Ajouter un commentaire

Aucun commentaire

Sujets populaires
Afficher plus
#
ShareYourUSStocksWinNvidia
3.67M Popularité
#
BitcoinRalliesOver5Percent
499.03M Popularité
#
IsraelStrikesIranBTCPlunges
56.22K Popularité
#
WinGoldBarsWithGrowthPoints
1.34M Popularité
#
StrongNonfarmPayrollsRekindleRateHikeFear
1.81M Popularité

Épinglé

#分享美股交易赢英伟达股票

Sujets populaires

ShareYourUSStocksWinNvidia

BitcoinRalliesOver5Percent

IsraelStrikesIranBTCPlunges

WinGoldBarsWithGrowthPoints

StrongNonfarmPayrollsRekindleRateHikeFear

Épinglé