Comment l’application AI peut-elle trouver un espace de monétisation durable ?

Question

Consommation : le modèle d'abonnement à l'IA grand public est pris dans un dilemme : les coûts des tokens montent en flèche alors que la volonté de payer des utilisateurs ne suit pas. Cette tension structurelle rend ce modèle économique extrêmement fragile. Une IA commerciale plus durable pourrait émerger dans des scénarios impliquant des utilisateurs à forte valeur ajoutée, une intégration profonde dans les workflows et un lien direct avec les résultats commerciaux réels. C'est le postulat économique qui justifie l'existence des plateformes verticales d'IA. Dans le 9ᵉ numéro d'« Agentic Economy », nous analyserons trois cas – Harvey, Farther et Adyen – pour voir comment ils construisent un avantage concurrentiel dans un contexte de marchandisation des modèles de base. Nous aborderons également deux questions plus difficiles : ces avantages tiennent-ils toujours lorsque les subventions sur les tokens s'épuisent ? Et que signifie l'envoi d'équipes d'ingénieurs par OpenAI et Anthropic chez les clients entreprises ?

Toute technologie, une fois devenue suffisamment courante, cesse de générer une prime. Il en va de même pour les grands modèles généralistes. Avec la diminution des rendements marginaux de la compétition sur les paramètres, l'intelligence autrefois rare se transforme rapidement en une infrastructure publique marchandisée. Cela conduit à l'effondrement accéléré du modèle économique des applications légères qui ne font qu'appeler des API tierces sans capacité d'intégration contextuelle.

Mais la marchandisation n'est jamais une fin en soi. Chaque fois qu'une nouvelle technologie se généralise, elle transfère la valeur de ceux qui la possèdent vers ceux qui savent l'appliquer concrètement.

Cette règle donne aujourd'hui naissance à l'essor rapide des plateformes d'IA verticales.

Les plateformes d'IA verticales sont des couches applicatives qui s'immergent dans des secteurs spécifiques, encapsulent profondément les capacités des grands modèles généralistes et réorganisent les processus métier autour de workflows particuliers. En construisant leurs propres systèmes d'évaluation (Eval) et architectures multi-agents, ces plateformes rétrogradent les modèles de base sous-jacents en composants informatiques interchangeables, verrouillant ainsi les actifs de workflow les plus essentiels de l'industrie à l'intérieur du système. Leur principe fondamental est d'éliminer les frictions dans les processus métier et de transformer le travail professionnel complexe en un actif système accumulable.

Pour comprendre la validité de cette nouvelle piste, il faut d'abord clarifier un fait : ce pour quoi les entreprises et les professionnels paient, ce n'est jamais la taille des paramètres du modèle sous-jacent, mais sa capacité à s'intégrer profondément dans les workflows internes, à former une boucle fermée de données et à générer des revenus réels.

C'est pourquoi les experts juridiques facturant des tarifs horaires élevés, les conseillers financiers servant des clients fortunés et les grands commerçants traitant d'énormes volumes de transactions deviennent la cible privilégiée des nouvelles plateformes d'IA verticales. Ces groupes détiennent le pouvoir de décision budgétaire, assument des responsabilités de conformité et sont orientés vers des résultats commerciaux clairs. Qu'il s'agisse d'aider un avocat facturé 1 000 $ de l'heure à économiser dix heures, ou d'aider un conseiller en patrimoine à augmenter ses actifs sous gestion et à optimiser les rendements après impôts, la valeur créée peut être directement quantifiée. Cette liaison précise avec les producteurs à haute valeur ajoutée est la base économique qui permet à l'IA verticale de fonctionner.

Actuellement, cette exploration se déroule principalement dans deux directions.

D'une part, la réorganisation des workflows professionnels par l'IA, réduisant considérablement les coûts opérationnels qui n'étaient auparavant supportables que par les grandes institutions. Dans les secteurs juridique et patrimonial, les tâches à haut niveau d'exigence comme la conformité, la gestion des risques et la livraison professionnelle sont systématiquement prises en charge via des plateformes technologiques, permettant aux professionnels d'effectuer un travail plus dense avec moins de ressources.

D'autre part, la reconstruction des infrastructures transactionnelles, remodelant la connexion entre les commerçants et les agents. Dans le commerce agentique (Agentic Commerce), bien que l'interception d'intention et l'interaction en amont soient contrôlées par les laboratoires d'IA, la conversion finale des transactions se produit toujours du côté des infrastructures des commerçants. Adyen Agentic agit comme un traducteur universel, aidant les commerçants à se connecter une fois et à participer à diverses plateformes d'achat IA via différents protocoles, sans avoir à reconstruire leur système pour chaque nouveau protocole.

Les trois cas abordent des scénarios différents, mais tous capitalisent les compétences fondamentales difficiles à standardiser dans l'industrie en des actifs systématiquement accumulables et réutilisables. Harvey capitalise le jugement juridique et les connaissances sectorielles ; Farther capitalise les relations clients et la capacité d'optimisation fiscale des conseillers ; Adyen capitalise les données produits, l'adaptation protocolaire et la capacité de règlement des commerçants.

C'est ce que Satya Nadella, PDG de Microsoft, appelle le capital token : la valeur à long terme de l'IA ne provient pas seulement de l'exécution de tâches individuelles, mais aussi de la structuration du jugement, des connaissances et des workflows humains dans le système, créant ainsi des actifs capables d'auto-évolution grâce à des interactions continues.

1,9 milliard d'ARR et 460 millions de coûts de calcul : le jeu d'échelle intenable de Harvey

Harvey est l'un des échantillons les plus valorisés et à la croissance la plus rapide de la vague actuelle d'IA verticale. C'est sur Harvey que le potentiel et les difficultés de cette logique sont les plus concentrés.

Cette plateforme juridique, qui ne possède aucun modèle généraliste, a porté son ARR de 100 millions à 190 millions de dollars en cinq mois (août 2025 à janvier 2026) grâce à une personnalisation approfondie des workflows essentiels des cabinets d'avocats, atteignant une valorisation de 11 milliards de dollars. Cela montre qu'une plateforme verticale n'a pas besoin de participer à la lutte sous-jacente des modèles généralistes ; tant qu'elle comprend réellement les tâches sectorielles et reconstruit l'environnement de travail quotidien des utilisateurs à forte valeur ajoutée, elle peut établir une capacité de monétisation solide.

Mais derrière ces chiffres financiers impressionnants se cache une facture de calcul en constante augmentation.

Selon les données publiques, l'utilisation mensuelle de tokens de Harvey est passée d'environ 1 000 milliards à 12-13 000 milliards. À raison de 3 $ par million de tokens, le coût théorique annuel de l'inférence s'élève à 468 millions de dollars. Même si ce coût est actuellement réduit grâce aux remises des grands fournisseurs et à des technologies comme le Prompt Caching, la structure de coûts dépendante signifie qu'une fois les subventions réduites, la facture rebondira immédiatement. Sous cette pression financière, la croissance de l'ARR a du mal à se transformer en flux de trésorerie réels, et risque plutôt de se retourner contre l'entreprise.

C'est derrière le paradoxe de coût inévitable des applications IA natives : plus le produit est populaire, plus le coût d'inférence est élevé. Le coût marginal des SaaS traditionnels est proche de zéro, mais dans des scénarios juridiques à long contexte et haute densité d'inférence, chaque tâche complexe consomme du calcul réel. Développer des modèles propriétaires devient donc une nécessité dictée par les coûts, passant d'une option technique à une évidence.

Actuellement, Harvey met en œuvre une stratégie de post-entraînement de modèles propriétaires, en collaboration étroite avec Applied Compute pour effectuer un fine-tuning sectoriel juridique de modèles de base open source (comme GLM-5.1). Selon les dernières divulgations techniques, le modèle propriétaire post-entraîné a amélioré son taux de réussite aux rubriques (rubric pass rate) de 0,853 à 0,913 dans le benchmark juridique d'agent (LAB) de Harvey, dépassant GPT-5.5 xhigh et se rapprochant d'Opus 4.8 Max.

La compression des coûts est également significative. En remplaçant le modèle d'évaluation des modèles de pointe par GPT-5 Mini et en regroupant plusieurs critères d'évaluation en lots, le coût d'évaluation a été réduit de 40 à 100 fois. Cela permet à Harvey d'itérer continuellement son cycle d'évaluation à moindre coût, faisant du système d'évaluation privé un actif concurrentiel accumulable.

Plus remarquable encore est ce qui change derrière l'amélioration des performances : l'exhaustivité de la sortie, la précision numérique, la traçabilité des documents et la réduction des hallucinations – plusieurs comportements clés montrent des améliorations quantifiables. Pendant l'entraînement, le nombre d'appels d'outils du modèle diminue, mais chaque appel devient plus précis, et la consommation totale de tokens diminue également. En d'autres termes, le modèle apprend à travailler efficacement dans un environnement d'outils spécifiques, et ces schémas comportementaux accumulés par de nombreuses tâches juridiques sont plus difficiles à copier en externe que les paramètres du modèle.

Le cas de Harvey montre que la base concurrentielle des plateformes d'IA verticales s'approfondit. La conception des workflows et les relations clients sont certes importantes, mais la capacité de post-entraînement et de contrôle des modèles open source, le système d'évaluation privé et la capacité de génération de données, ainsi que l'architecture multi-agents et l'optimisation des coûts d'inférence, deviennent de nouvelles sources de différenciation.

La désorganisation de Farther : briser le lien des grands courtiers traditionnels avec leurs conseillers

Si Harvey comprime les coûts de livraison au sein des grandes organisations de services professionnels, la plateforme de gestion de patrimoine Farther montre comment aider les talents clés à échapper à l'attraction organisationnelle des géants traditionnels.

Farther est une plateforme technologique destinée aux conseillers indépendants (RIA), recrutant spécifiquement des conseillers en patrimoine ayant quitté des géants comme Morgan Stanley, Merrill Lynch, UBS et Goldman Sachs. Dans les régimes de courtage à service complet traditionnels, les conseillers supportent souvent des commissions faibles et une lourde charge administrative. Farther recrute directement les conseillers et intègre dans une plateforme unifiée les capacités back-office auparavant monopolisées par les grandes institutions : en plus de commissions élevées, la récolte de pertes fiscales, l'indexation directe, l'accès aux marchés privés, la vérification de conformité et la gestion documentaire sont intégrées. Selon les données officielles, le seul algorithme fiscal intelligent améliore le rendement après impôt des clients de 1 à 3 %.

Ce modèle a reçu une confirmation forte du marché des capitaux. En mai 2026, Farther a réalisé un tour de série D de 150 millions de dollars mené par General Atlantic, entrant officiellement dans le club des licornes. Actuellement, les actifs sous gestion qu'il a recrutés et gérés dépassent 23 milliards de dollars, dont une équipe de banque privée vedette récemment débauchée de Goldman Sachs Private Wealth, avec 1,5 milliard de dollars d'actifs sous gestion. L'afflux continu de conseillers en patrimoine indépendants montre que le lien systémique sur lequel reposaient les grands courtiers traditionnels est en train de se briser, et que l'exercice indépendant sans attache institutionnelle n'est plus une option marginale.

Harvey se concentre sur l'amélioration de l'efficacité de livraison professionnelle au sein des cabinets d'avocats ; Farther construit à partir de zéro une plateforme indépendante permettant aux conseillers de bénéficier de capacités back-office équivalentes, voire supérieures, sans dépendre des grands courtiers traditionnels. Les deux ont des points d'entrée différents, mais redéfinissent tous deux la manière de produire des services professionnels. Soutenus par cette plateforme, des instruments d'investissement complexes auparavant réservés aux départements ultra-wealthy (UHNW) des grandes institutions, comme l'indexation directe et les marchés privés, peuvent désormais être facilement orchestrés par des conseillers indépendants, étendant considérablement le champ d'activité des professionnels individuels.

Les SaaS traditionnels ne peuvent gérer que l'automatisation superficielle des processus comme la tenue de registres et le stockage, sans pouvoir partager les décisions complexes et la coordination. En revanche, les systèmes IA natifs basés sur des architectures multi-agents sont naturellement adaptés pour prendre en charge ces zones grises entre exécution administrative et logique de décision non standardisée : vérification de conformité, rédaction de documents personnalisés, conseil en allocation d'actifs, etc. Ces tâches, qui nécessitaient auparavant une équipe entière de back-office, sont rapidement digérées par le système.

Le côté commerçant sous-estimé : la boucle transactionnelle de l'Agentic Commerce

L'Agentic Commerce est très en vogue, mais l'attention médiatique actuelle est presque entièrement monopolisée par le consommateur – comment les assistants IA remplacent les utilisateurs pour rechercher des produits, comparer les prix et passer commande automatiquement. En revanche, les retours concrets du côté des commerçants sont bien plus froids.

Le taux de conversion du checkout natif IA (Instant Checkout) de Walmart n'est actuellement qu'un tiers de celui du modèle traditionnel de clic et redirection ; et la proportion de commerçants ayant réellement intégré le système de checkout IA de Shopify reste limitée en 2026. Il existe un fossé évident entre l'activation de la demande par l'IA et la conclusion effective de la transaction.

La raison de ce fossé est que les transactions agentiques sont un projet systémique. Comprendre l'intention de l'utilisateur n'est que la première étape ; pour transformer une demande en revenus, il faut une chaîne complète incluant la vérification des stocks, le calcul des taxes, la prévention de la fraude, l'exécution et le règlement financier – des capacités actuellement verrouillées dans les systèmes locaux des commerçants. Parallèlement, plusieurs protocoles de paiement agentique coexistent sans interopérabilité (UCP, ACP, AP2, Agent Pay, Visa Tokenization, etc.), et les commerçants n'ont ni la motivation de s'adapter à chacun ni les moyens de supporter les coûts de la fragmentation technique.

Adyen a lancé Adyen Agentic, qui, via trois couches d'API modulaires, couvre différentes étapes de la chaîne transactionnelle :

Agentic Feed : se charge de normaliser et de distribuer le catalogue produits, les prix et les données d'inventaire en temps réel des commerçants vers les principales plateformes IA ;
Agentic Cart : connecte les systèmes existants de checkout, de taxes, d'exécution et de gestion des commandes des commerçants au socle du commerce conversationnel ;
Agentic Payments : gère la vérification d'identité, la gestion des risques réseau et le règlement multicanal dans les transactions initiées par les agents.

Avec une seule intégration, les commerçants peuvent être traduits par Adyen à travers différentes plateformes et protocoles d'agents IA, sans avoir à reconstruire leurs systèmes à chaque changement de configuration du marché.

Dans l'écosystème du commerce agentique, les laboratoires d'IA et les interfaces conversationnelles en amont peuvent capter l'intention des utilisateurs et le trafic, mais la conversion substantielle de valeur, la conclusion des transactions et la boucle de financement restent fortement dépendantes des infrastructures côté commerçant. Par rapport aux points d'entrée frontaux très concurrentiels, les services d'intégration côté commerçant ont plutôt plus de chances de devenir une infrastructure stable et facturable.

Les inquiétudes des plateformes verticales : la pénétration des fabricants de modèles et la restructuration des coûts de tokens

Avec la saturation du marché des outils généralistes à bas prix, la logique commerciale des grandes plateformes de modèles reposant sur des abonnements à faible prix unitaire montre sa fragilité. Lorsque des fonctions généralistes comme résumer des pages web ou rédiger des emails sont facilement remplaçables, les plateformes verticales doivent se concentrer sur des clients à haute valeur ajoutée plus sensibles aux résultats. Mais plus on monte vers des secteurs à forte valeur, plus l'environnement concurrentiel de la couche applicative devient complexe.

L'une des pressions vient de l'extension active du périmètre commercial des fabricants de modèles. OpenAI et Anthropic ne se contentent plus d'être des grossistes d'API ; ils déploient des équipes d'ingénieurs de terrain (FDE) directement chez les clients clés. En avril 2026, OpenAI a conclu un partenariat avec Customers Bank (26 milliards d'actifs), dont l'équipe d'ingénieurs s'est installée dans la banque pour développer des agents de prêt et d'ouverture de compte à partir de données locales ; Anthropic a collaboré avec le géant des technologies financières FIS, intégrant ses équipes FDE dans leurs systèmes internes pour développer des outils de lutte contre le blanchiment d'argent, en s'appuyant sur le réseau de FIS qui dessert de nombreuses banques pour atteindre directement les couches les plus profondes des opérations bancaires.

Ce mode de collaboration sur site montre que les grands fabricants de modèles utilisent les canaux d'infrastructure pour apprendre et reproduire directement les processus métier des secteurs à haute barrière à l'entrée.

Une autre pression est la logique de tarification des tokens, insoutenable à long terme. Actuellement, les tokens de la plupart des modèles de base avancés sont vendus à perte après subvention. Avec l'utilisation intensive des architectures multi-agents en entreprise, une fois les subventions des grands fabricants retirées, les plateformes verticales dépendantes des API externes de pointe ne pourront plus faire face à leurs factures de calcul.

Cette pression s'amplifie avec la montée de la demande d'inférence. Lorsque des centaines d'agents fonctionnant 24 heures sur 24 interagissent en arrière-plan à haute fréquence, la demande de calcul croît de manière exponentielle, tandis que la chaîne d'approvisionnement matérielle sous-jacente, contrainte par des cycles de production extrêmement longs comme ceux des machines de lithographie ASML, ne peut pas suivre rapidement. Pour la plupart des tâches quotidiennes, utiliser les modèles de pointe pour tout traiter est un grave gaspillage de ressources.

C'est précisément la raison pour laquelle Harvey doit collaborer avec Applied Compute pour établir des ensembles de tests dédiés, un système d'évaluation privé et une pipeline d'annotation manuelle : les plateformes verticales ne font pas seulement du produit, elles font de l'ingénierie de coûts à haute difficulté : mesurer précisément la consommation de tokens de chaque tâche, déterminer quelles étapes intermédiaires peuvent être déléguées à des modèles open source à faible coût, quelles décisions clés doivent appeler les modèles phares coûteux, et où l'intervention humaine doit être positionnée.

Dans ce contexte, une simple couche d'interface de workflow bien conçue ne suffit plus à offrir un avantage concurrentiel durable. Atteindre l'excellence dans l'ingénierie des coûts en back-end devient la clé de la survie à long terme des plateformes d'IA verticales.

Conclusion : la rareté du marché retourne au sommet de la chaîne industrielle

Lorsque les grands modèles généralistes deviennent aussi accessibles que l'eau, l'électricité et le gaz, la valeur de la couche applicative de l'IA se déplace vers l'extrémité amont et l'extrémité aval de la chaîne industrielle.

À ce stade, la rareté sectorielle n'a pas disparu : à l'extrémité amont se trouvent toujours les éléments non standardisables par algorithmes – la confiance des clients, les jugements complexes non standard et les connaissances non structurées enfouies dans l'expérience des praticiens ; à l'extrémité aval se trouvent les réseaux de commerçants, qui portent les données produits, les chaînes de conformité et les canaux de paiement. Le sens véritable des plateformes verticales est de transformer l'expérience professionnelle de ces acteurs à haute valeur ajoutée en un capital token accumulable.

Cela détermine également que la logique concurrentielle de la couche applicative revient au pragmatisme. Le « récit d'échelle » qui a soutenu la course effrénée de l'industrie logicielle pendant une décennie commence à montrer ses limites face à la rigidité des coûts de calcul et de la chaîne d'approvisionnement physique.

Dans le nouveau cycle, la survie des entreprises de la couche applicative dépendra d'une arbitrage fin entre coûts et puissance de calcul. Avec le reflux de la guerre des prix des modèles et la limitation des ressources informatiques, les plateformes applicatives devront trouver le juste équilibre entre coût et performance, plutôt que de continuer à dépendre de l'apport de capitaux.

Bien que les fabricants de grands modèles disposent de plus grandes ressources de calcul et d'équipes d'ingénieurs de terrain, pour les plateformes verticales agiles et les professionnels indépendants, l'avantage concurrentiel le plus distinctif reste la capacité à transformer leur propre expérience professionnelle tacite en un actif système que les fabricants de modèles de base ne peuvent pas reproduire. Éviter la concurrence généralisée sur le trafic et donner la priorité à la réalisation de la boucle commerciale des producteurs à haute valeur ajoutée, c'est la logique qui permet à l'IA verticale de survivre à long terme à l'ère de la marchandisation des grands modèles.

Voir l'original

Comment l’application AI peut-elle trouver un espace de monétisation durable ?

1,9 milliard d'ARR et 460 millions de coûts de calcul : le jeu d'échelle intenable de Harvey

La désorganisation de Farther : briser le lien des grands courtiers traditionnels avec leurs conseillers

Le côté commerçant sous-estimé : la boucle transactionnelle de l'Agentic Commerce

Les inquiétudes des plateformes verticales : la pénétration des fabricants de modèles et la restructuration des coûts de tokens

Conclusion : la rareté du marché retourne au sommet de la chaîne industrielle

Sujets populaires

SKHynixTopsKOSPIByMarketCap

MicronEarningsBeatExpectationsSharesRise

IsraelStrikesIranBTCPlunges

WorldCup🏴󠁧󠁢󠁳󠁣󠁴󠁿vs🇧🇷

USMayPCEInflationRisesTo4.1%HighestIn3Years

Épinglé