Rapport sur l'état actuel de la recherche sur le protocole de paiement AI : une architecture à double couche en cours de formation

De septembre 2025 à mars 2026, au cours des six mois, chaque acteur majeur du secteur des paiements à l’échelle mondiale a mené des actions d’envergure. OpenAI et Stripe ont publié conjointement le protocole Agentic Commerce Protocol (ACP). Google a lancé le Universal Commerce Protocol (UCP). En l’espace d’une semaine, Visa et Mastercard ont successivement publié leurs propres cadres de paiement par agents. Dans les deux mois qui ont suivi, le protocole x402 de Coinbase, sur la chaîne Base, a cumulé plus de 15 millions de transactions traitées. En mars 2026, Stripe et Tempo ont publié conjointement le Machine Payments Protocol (MPP).

Ces actions denses de ces géants de la technologie et d’institutions financières ne sont absolument pas fortuites : elles constituent une réponse collective du secteur des paiements au même défi. Lorsque l’AI Agent devient le principal acteur de consommation actif sur Internet, les infrastructures de paiement existantes ne peuvent tout simplement plus satisfaire, de manière fondamentale, ses besoins de fonctionnement.

Chaque conception du système de paiement traditionnel repose sur l’hypothèse d’une « opération humaine » : dépendre d’une interface de navigateur, remplir manuellement des formulaires, cliquer sur « Confirmer le paiement », puis vérifier l’identité via un code de vérification. La logique de fonctionnement d’un agent est radicalement différente : il a besoin d’interfaces standards lisibles par machine, de réponses d’autorisation à l’échelle de la milliseconde et d’une infrastructure adaptée au règlement fréquent de petits montants.

Cette bataille d’infrastructures ne sera pas dominée par un seul protocole, mais elle est en train de former une architecture à deux niveaux clairement distincte. La couche d’intention définit « qui est le marchand, et comment l’appariement/la mise en relation se fait » ; la couche de règlement définit « comment les fonds circulent concrètement ». Les deux couches sont indépendantes l’une de l’autre, évoluent séparément, mais aucune des deux n’est indispensable. S’il manque une couche, la boucle commerciale du cycle complet de l’économie des agents ne peut pas être réalisée.

Première partie : couche d’orchestration des intentions

La couche d’orchestration des intentions est chargée de transformer les intentions de transaction des Agents en un flux de bout en bout exécutable : découverte de biens ou de services, ajout au panier, déclenchement du paiement. Cette couche forme actuellement deux filières dont la nature est radicalement différente.

1.1 Agent achète à la place de l’utilisateur

Le cœur du conflit de cette filière n’est pas le paiement, mais l’accès. Les plateformes e-commerce traditionnelles sont conçues pour les utilisateurs humains : un agent ne peut pas analyser des pages visualisées, ni cliquer sur des éléments d’interaction. Pour que l’agent achète à la place d’un humain, le marchand doit fournir des interfaces standardisées lisibles par machine.

ACP (Agentic Commerce Protocol) : expérience d’achat par IA dans un écosystème fermé

L’ACP a été publiée conjointement par OpenAI et Stripe en septembre 2025. Son mécanisme central repose sur le paiement délégué : lors de la confirmation de l’achat, l’utilisateur confie les droits de paiement à l’agent ; l’agent effectue la transaction à l’aide d’un justificatif de paiement conforme à Delegated Payment Spec ; le marchand conserve le statut de Merchant of Record. À l’heure actuelle, le SPT de Stripe est la première et l’unique solution concrète de ce système.

ChatGPT Instant Checkout a été lancé en septembre 2025, mais a été arrêté en mars 2026 en raison d’un taux de conversion trop faible. OpenAI a déplacé son centre de gravité stratégique vers la découverte de produits : après que ChatGPT a présenté les produits, il attire l’utilisateur vers le site natif du marchand afin d’effectuer la transaction. Le protocole ACP lui-même subsiste sous une forme plus concise, en prenant en charge des applications ChatGPT exclusives pour plusieurs grands détaillants ; les marchands doivent demander leur adhésion, et OpenAI contrôle l’affichage.

UCP (Universal Commerce Protocol) : stratégie de long terme basée sur des standards ouverts

L’UCP a été annoncé en personne par le PDG de Google, Sundar Pichai, en janvier 2026 lors de la conférence annuelle de la NRF sur la distribution ; il compte déjà plus de 30 partenaires, couvrant des plateformes grand public comme Shopify, Stripe, Visa, Mastercard, Walmart, Wayfair, etc. Le mécanisme central de l’UCP repose sur la déclaration des capacités des marchands : les marchands publient, sur leur propre domaine, un fichier de configuration UCP au format JSON, dans lequel ils déclarent les capacités de transmission et de paiement qu’ils prennent en charge ; l’IA peut le lire directement. Google s’appuie ainsi pour transformer Gemini en couche centrale de découverte pour les achats des Agents.

La différence clé tient au fait que Google évite intentionnellement le rôle d’intermédiaire. Il n’a pas besoin de détenir la transaction elle-même : il lui suffit de contrôler l’amont, c’est-à-dire la découverte des produits. L’ACP et l’UCP ne sont pas en concurrence : elles représentent deux revendications de marché différentes. La première échange un écosystème fermé contre une expérience utilisateur et un pouvoir de contrôle maximaux ; la seconde échange un standard ouvert contre un effet à plus grande échelle et l’interopérabilité.

1.2 Transactions entre Agents

Si la filière A résout la question de la manière dont l’Agent effectue des achats à la place d’un humain, la filière B doit résoudre un problème encore plus fondamental : lorsque les deux parties à la transaction sont des Agents et qu’aucun humain-marchand n’intervient, d’où vient la confiance ? Les Agents entre eux n’ont pas de garanties de réputation ; les réglementations de protection des consommateurs ne peuvent pas s’appliquer. Le cœur du problème est le suivant : comment garantir la fiabilité de l’échange de valeur dans un environnement sans confiance.

ERC-8183 + ERC-8004 : contrats de tâche dé-selon-la-confiance sur la chaîne

L’ERC-8183 a été lancé en mars 2026 en coopération entre l’équipe dAI de la Fondation Ethereum et Virtuals Protocol. Chaque Job est composé de trois parties : Client (partie déléguante), Provider (partie fournissant le service) et Evaluator (évaluateur) ; les fonds sont mis en dépôt via un smart contract jusqu’à l’achèvement de l’acceptation de la tâche. Les parties à la transaction n’ont pas besoin de se faire mutuellement confiance : il suffit de faire confiance au contrat lui-même. L’ERC-8004 constitue un protocole d’identité associé : après l’enregistrement de chaque Agent sur la chaîne, une note de réputation est calculée à partir de l’historique des transactions. À l’échelle de tout le réseau, environ 24 000 Agents sont déjà enregistrés.

Butler de Virtuals Protocol est le plus grand moteur de ce système : après avoir découpé des tâches complexes, il les attribue à des Agents spécialisés pour exécution. Ce modèle vise à généraliser ce mécanisme de contrat à trois parties en tant que standard ouvert, mais l’adoption par un grand nombre de développeurs demandera encore du temps.

Les différences structurelles entre les deux filières influencent directement le choix des protocoles de la couche de règlement : les transactions de la filière A s’alignent naturellement avec les canaux de monnaie fiduciaire ; les transactions de la filière B s’appuient naturellement sur des canaux de stablecoins.

Deuxième partie : couche de règlement

Si la couche d’orchestration des intentions détermine « quoi on échange », alors la couche de règlement doit résoudre « comment l’argent arrive de façon fiable ». À l’heure actuelle, cinq protocoles se disputent ce domaine ; leurs logiques de conception et leurs scénarios d’application mettent l’accent chacun sur des points différents.

2.1 Delegated Payment / SPT (Stripe)

  • Idée centrale : étendre l’écosystème existant des paiements par cartes bancaires, au lieu de le reconstruire.

  • Fonctionnement : lorsque l’utilisateur autorise l’Agent, Stripe génère un jeton de paiement partagé (SPT), que l’agent conserve. Lorsqu’une transaction a lieu, l’agent présente ce jeton, qui a une durée de validité et un plafond de montant. Les fonds sont ensuite réglés via le canal de paiement par carte standard de Stripe. En arrière-plan, Stripe a déjà connecté ses interfaces avec « AI-Ready » de Visa et « Agentic Token » de Mastercard. Ainsi, quelle que soit l’organisation de cartes sous-jacente qui exécute la transaction, le marchand fait face à une interface SPT unifiée.

  • Scénarios d’application : particulièrement adapté au commerce de détail standard et aux transactions de montants importants, et notamment aux paiements entre agents qui nécessitent des mécanismes de protection des consommateurs comme les chargebacks par carte de crédit.

  • Principales limites : son architecture dépend des réseaux de cartes traditionnels, ce qui ne convient pas aux scénarios de paiements inter-machines fréquents et de très petits montants (par exemple, inférieurs à 1 centime).

2.2 Visa Intelligent Commerce et Mastercard Agentic Token

  • Idée centrale : mettre à niveau la technologie de tokenisation des organisations de cartes traditionnelles pour l’adapter aux transactions d’agents.

  • Fonctionnement : remplacer les numéros de carte réels par des jetons de paiement cryptés dynamiquement. Chaque jeton est lié à des métadonnées telles que l’identité de l’Agent, la limite de dépense, la période de validité et la plage de marchands négociables. Le décompte et la compensation des fonds s’effectuent néanmoins toujours via le réseau de cartes bancaire existant.

  • État d’avancement : Mastercard a, en septembre 2025, collaboré avec la Commonwealth Bank of Australia pour réaliser la toute première transaction d’Agent avec identification complète au niveau mondial. Visa a aussi mené un déploiement initial en Europe via son programme « AI Ready ».

  • Principales limites : la structure des frais minimums inhérente aux réseaux de cartes bancaires impose une contrainte forte, rendant difficile la prise en charge des micro-paiements qui pourraient devenir extrêmement fréquents à l’avenir, notamment ceux inférieurs à 1 USD.

2.3 x402 (Coinbase)

  • Idée centrale : revenir aux protocoles de base d’Internet et utiliser le code d’état « demande de paiement 402 » peu exploité dans la norme HTTP pour intégrer le paiement nativement.

  • Fonctionnement : lorsqu’un Agent demande une ressource nécessitant un paiement, le serveur renvoie une réponse 402 ainsi que les paramètres de paiement. Après que l’Agent a signé l’autorisation, le nœud de règlement du protocole exécute l’échange atomique on-chain (généralement en utilisant USDC), ce qui prend environ deux secondes. L’ensemble du processus ne nécessite ni inscription de compte, ni clé API, ni vérification d’identité.

  • Données et état actuel : à la fin de 2025, le protocole a traité plus de 100 millions de transactions sur plusieurs chaînes. Toutefois, des analyses indiquent qu’une part importante du trafic correspond à des tests internes au protocole et à des transactions en boucle. Son architecture peut concevoir des paiements au niveau du « fractionnement de monnaie », sans limite de frais minimum, mais le défi actuel consiste à accroître la densité d’adoption dans des scénarios commerciaux réels et la qualité des transactions.

2.4 Nanopayments (Circle)

  • Idée centrale : en tant que solution améliorée de x402, optimiser spécifiquement les modèles économiques des scénarios de paiements extrêmement fréquents et de très petits montants.

  • Fonctionnement : il déclenche également une réponse HTTP 402, mais au niveau de la couche de règlement il adopte une architecture de traitement par lots : le payeur dépose d’abord l’USDC dans la passerelle Circle, puis les paiements sont autorisés via une signature hors-chaîne ; des règlements on-chain sont ensuite exécutés par lots à intervalle régulier. Cela réduit le coût du gaz à un niveau négligeable, permettant des paiements aussi faibles que un millionième de dollar.

  • Principales limites : les deux parties à la transaction doivent ouvrir préalablement un compte et déposer des fonds auprès de la passerelle Circle ; cela en fait, dans une certaine mesure, un système semi-fermé, incapable de réaliser des arrivées de fonds atomiques en temps réel. Le protocole a lancé son testnet en mars 2026.

2.5 MPP (Tempo + Stripe)

  • Idée centrale : construire un cadre de paiement unifié et modulable multi-canal, tout en demandant à être reconnu comme « solution officielle » de déploiement pour HTTP 402.

  • Innovation clé : il permet aux développeurs d’intégrer plusieurs voies de paiement au sein d’un même cadre de protocole. Pendant la transaction, l’Agent peut choisir selon le besoin :

  • Voie de stablecoin Tempo : prise en charge du règlement on-chain à chaque transaction ou du règlement groupé de sessions hors-chaîne.

  • Voie fiduciaire Stripe : paiement par carte via un jeton de paiement partagé.

  • Voie de liaison directe des organisations de cartes : utilisation directe des jetons intelligents de Visa/Mastercard.

  • Réseau Lightning Bitcoin : intégration via Lightspark.

  • Caractéristique clé : MPP introduit la notion de « session de paiement », semblable à OAuth. Après une préautorisation et un rechargement uniques, l’Agent peut effectuer des paiements continus, en temps réel, sans friction au sein d’une session, sans avoir besoin de mettre chaque transaction on-chain.

  • Signification stratégique : dans ce dispositif, Stripe joue un double rôle : il est à la fois un co-constructeur du protocole et une option de paiement fournie dans le protocole lui-même. Cela signifie que, quel que soit le choix final du marché entre le système HTTP 402 ouvert et les canaux fiduciaires traditionnels, Stripe pourra garantir que son activité de paiement centrale soit intégrée dans l’écosystème futur.

Troisième partie : situation actuelle, défis et opportunités

3.1 Situation actuelle et défis

Au cours des six derniers mois, tous les protocoles de base concernés ont été mis en ligne, mais l’avancement de la commercialisation dans son ensemble accuse un retard. Dans la couche de règlement, les volumes de transactions x402 sont en tête, mais le montant réel des transactions commerciales quotidiennes se situe autour de 28 000 USD. Dans la couche d’orchestration, le produit central de l’ACP a été arrêté en raison d’un taux de conversion trop faible. Les nouveaux protocoles comme ERC-8183 et MPP font face à une situation générale où le récit précède le déploiement. Cela marque une étape clé : la construction de l’architecture des protocoles est globalement achevée, mais les applications commerciales à grande échelle n’ont pas encore démarré.

Le défi central actuel réside dans la fragmentation de la couche d’orchestration des intentions. Les marchands doivent gérer simultanément plusieurs normes indépendantes, des SDK distincts et des processus de conformité ; cela entraîne des coûts d’intégration élevés et des attentes floues. L’histoire montre que les marchés fragmentés finissent par engendrer une couche d’intégration unifiée, mais cette fois-ci peut être différent : les plateformes qui contrôlent les points d’entrée de trafic (comme OpenAI, Google et Microsoft) ont de fortes incitations à construire et à maintenir leurs propres écosystèmes fermés, plutôt que de pousser une intégration ouverte. Cette logique se déroule en parallèle sur le marché mondial ; par conséquent, le paysage final a de fortes chances d’évoluer vers la coexistence de plusieurs écosystèmes fermés régionaux, plutôt que vers un seul standard ouvert unifié. Ainsi, à l’avenir, la couche d’intégration ne sera pas construite par les plateformes, mais par des prestataires d’infrastructure tiers au service des marchands.

3.2 Opportunités de marché

Sur la base du jugement ci-dessus, les opportunités sont claires à deux niveaux :

Couche de règlement : l’opportunité la plus certaine

Quel que soit le degré de fragmentation de l’écosystème au-dessus, le paiement reste un problème fondamental que tout Agent doit résoudre. Une tendance nette se dessine : en raison des intérêts des plateformes, la couche d’orchestration continue de se fragmenter ; pendant ce temps, la couche de règlement, sous la pression de l’efficacité pesant sur les développeurs, s’oriente vers l’abstraction et l’intégration. Les développeurs ne peuvent pas maintenir des intégrations de paiement indépendantes pour chaque écosystème ; la dynamique économique en faveur d’une intégration vers une solution unifiée s’intensifie.

Cela impose une exigence claire aux portefeuilles d’Agents : ils doivent prendre en charge plusieurs voies de paiement. Les voies fiduciaires (comme SPT, Agentic Token) couvrent la consommation physique traditionnelle ; les voies en stablecoins (comme x402, MPP Session) couvrent les services on-chain et les transactions A2A. Les deux scénarios coexistent et ne fusionneront pas à court terme. La responsabilité d’une adaptation flexible incombe du côté de l’Agent, et non du côté du marchand : le marchand choisit quelles voies de paiement il supporte, ce qui est une décision relativement stable ; l’entreprise fournit des stablecoins et des cartes autorisées à l’Agent, et l’Agent peut ensuite effectuer les paiements selon les voies supportées par le contrepartiste. Seuls les portefeuilles capables de gérer plusieurs voies peuvent couvrir l’ensemble des scénarios de consommation d’un Agent. Leur valeur s’accumulera continûment à chaque transaction à travers différents écosystèmes, formant une solide « douve » d’infrastructure.

Économie A2A et reconstruction des modèles économiques : une direction de long terme, une mer bleue

Le véritable espace vide du marché se situe dans la couche applicative, les services. À l’heure actuelle, l’économie A2A reste cantonnée à des scénarios natifs des crypto-monnaies. D’un point de vue technique, faire « embaucher » par un Agent un autre Agent pour accomplir une tâche réelle (par exemple, analyse de données, création de contenu, recherche juridique, revue de code) est totalement faisable ; toutefois, l’offre de services d’API correspondants, appelés à la demande, est extrêmement rare. C’est là la plus grande opportunité à long terme, et aussi la direction où la concurrence est la plus faible.

Cette opportunité est actuellement limitée par un vrai problème de démarrage à froid. Les mécanismes de confiance fondés sur la réputation, comme ERC-8183, nécessitent une densité de transactions suffisante pour produire des signaux de confiance significatifs. Microsoft prévoit que le nombre d’AI Agents actifs atteindra 1,3 milliard en 2028 ; or, le nombre actuel se situe à un ordre de grandeur différent de cet objectif. Ce n’est pas un manque temporaire qui se résorbera naturellement : c’est un seuil que l’économie A2A doit franchir pour s’étendre au-delà de la crypto.

Sa signification plus profonde réside dans la reconstruction des modèles économiques. Les principaux modèles Internet d’aujourd’hui en publicité et en abonnement reposent sur l’hypothèse que « l’utilisateur est humain ». Les Agents ne sont pas affectés par la publicité et n’ont pas besoin d’un abonnement mensuel : ils ne paient que pour le résultat d’une tâche unique. Les modèles « facturation à l’appel », représentés par HTTP 402, offrent une nouvelle voie aux fournisseurs de services API : passer de la vente d’autorisations d’accès à la vente de résultats exacts, et ainsi réaliser des échanges de valeur plus précis. L’extension de l’économie A2A et l’adoption généralisée de HTTP 402 ne sont, au fond, que deux faces d’une même proposition.

Conclusion

Le commerce des Agents évoluera selon deux dimensions. Côté consommateurs (Agent qui achète à la place de l’utilisateur), la tendance dépendra principalement des voies basées sur cartes ; l’évolution dépendra de la mise en place de l’autorisation des entreprises et de la confiance des utilisateurs. Entre Agents (A2A), la technologie est prête sur la voie des stablecoins ; il ne reste plus qu’à attendre la mise à l’échelle des applications et des services.

Au final, le paysage se construira par une évolution coordonnée d’une pile de protocoles à deux niveaux : la couche d’orchestration des intentions détermine comment la transaction a lieu, tandis que la couche de règlement garantit comment la valeur circule.

Pour les bâtisseurs, l’enjeu clé à présent est de construire des capacités d’accès et d’intégration étendues. Ceux qui sauront router automatiquement des transactions entre protocoles et soustraire aux développeurs la complexité sous-jacente occuperont une position structurellement avantageuse lors de l’explosion du marché. C’est une valeur qui s’accumule silencieusement, et qui sera difficile à remplacer.

Le point de bascule sera déclenché au moment où les entreprises accepteront de déléguer des autorisations de dépenses à l’Agent : cela inclut un suivi des transactions auditables, des mécanismes de délégation de budget et une attribution claire des responsabilités en cas de mauvais achat par l’Agent. À ce moment-là, un portefeuille d’Agents couvrant simultanément plusieurs voies de paiement et un catalogue de services « à la demande » facile à utiliser deviendront les deux infrastructures les plus critiques et encore non occupées. Ces deux positions ne disposent pas actuellement d’acteurs fortement installés, et elles deviendront tout aussi essentielles au même moment.

VIRTUAL3,45%
DAI-0,04%
ETH3,69%
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler