Futures
Accédez à des centaines de contrats perpétuels
CFD
Or
Une plateforme pour les actifs mondiaux
Options
Hot
Tradez des options classiques de style européen
Compte unifié
Maximiser l'efficacité de votre capital
Trading démo
Introduction au trading futures
Préparez-vous à trader des contrats futurs
Événements futures
Participez aux événements et gagnez
Demo Trading
Utiliser des fonds virtuels pour faire l'expérience du trading sans risque
CFD
Produits dérivés CFD sur actions américaines
US Stocks
Accédez à de véritables actions et ETF américains
HK Stocks
Tradez des actions des actions de qualité cotées à Hong Kong
Futures sur actions
Effet de levier élevé, trading 24h/24 et 7j/7
Actions tokenisées
Adossé à de véritables actions
IPO Access
Accédez à l'intégralité des introductions en bourse mondiales
GUSD
Mint GUSD pour des rendements de Treasury RWA
Activités boursières
Tradez des actions populaires et débloquez des airdrops généreux
Lancer
CandyDrop
Collecte des candies pour obtenir des airdrops
Launchpool
Staking rapide, Gagnez de potentiels nouveaux jetons
HODLer Airdrop
Conservez des GT et recevez d'énormes airdrops gratuitement
IPO Access
Accédez à l'intégralité des introductions en bourse mondiales
Points Alpha
Tradez on-chain et gagnez des airdrops
Points Futures
Gagnez des points Futures et réclamez vos récompenses d’airdrop.
Investissement
Simple Earn
Gagner des intérêts avec des jetons inutilisés
Investissement automatique
Auto-invest régulier
Double investissement
Profitez de la volatilité du marché
Staking souple
Gagnez des récompenses grâce au staking flexible
Prêt Crypto
0 Fees
Mettre en gage un crypto pour en emprunter une autre
Centre de prêts
Centre de prêts intégré
Gestion de patrimoine VIP
Plans premium de croissance
Gestion privée de patrimoine
Allocation premium d'actifs
Fonds Quant
Stratégies quantitatives
Staking
Stakez des cryptos pour gagner avec les produits PoS.
Levier Smart
Effet de levier sans liquidation
USD1 Intérêts sur holding
Sans blocage, tradez & retirez
Promotions
Centre d'activités
Participez et gagnez des récompenses
Parrainage
20 USDT
Invitez des amis et gagnez des récompenses
Programme d'affiliation
Obtenez des commissions exclusives
Gate Booster
Développez votre influence et gagnez des airdrops
Annoncement
Mises à jour en temps réel
Blog Gate
Articles sur le secteur de la crypto
AI
Gate AI
Votre assistant IA polyvalent pour toutes vos conversations
Gate AI Bot
Utilisez Gate AI directement dans votre application sociale
GateClaw
Gate Blue Lobster, prêt à l’emploi
Gate for AI Agent
Infrastructure IA, Gate MCP, Skills et CLI
Gate Skills Hub
+10K compétences
De la bureautique au trading, une bibliothèque de compétences tout-en-un pour exploiter pleinement l’IA
Combien le fournisseur de modules optiques peut-il obtenir des frais d'abonnement que vous confiez à Claude ?
TL;DR
Une estimation illustrant la décomposition d’environ 20 dollars par mois pour Claude Pro aux États-Unis, répartis entre le modèle, le cloud, l’amortissement GPU, l’électricité et la chaîne d’approvisionnement, remet en question la façon dont les investisseurs évaluent réellement les revenus des applications IA.
Ce diagramme n’est pas une donnée officielle de répartition d’OpenAI, Amazon Cloud ou Nvidia, ni une comptabilité réelle d’une entreprise. Sa valeur réside dans la soulevée d’une question fondamentale : combien des abonnements payés par les utilisateurs pour une application IA peuvent, comme dans le SaaS traditionnel, se transformer en marge brute logicielle ?
L’évaluation des SaaS traditionnels est claire. Après le développement, vendre un compte supplémentaire a peu de coûts additionnels, et la marge brute des entreprises de logiciels matures dépasse souvent 70% voire 80%. Les investisseurs sont prêts à valoriser ces entreprises à des multiples élevés parce qu’avec l’expansion du chiffre d’affaires, la rentabilité peut continuer à s’améliorer.
Le problème avec les applications IA est que chaque question, codage, analyse de fichier ou appel à un agent consomme en arrière-plan du temps GPU, de l’électricité, de la bande passante mémoire et des ressources cloud. Bien que le prix soit une mensualité fixe, la chaîne de coûts sous-jacente varie avec l’usage. Un utilisateur léger peut avoir une marge élevée, tandis qu’un utilisateur intensif, utilisant ses quotas ou des forfaits d’outils, peut voir ses coûts grimper rapidement.
Ainsi, le diagramme de décomposition de 20 dollars ne remet pas en question combien une entreprise gagne en dollars, mais si « les revenus des applications IA sont intrinsèquement équivalents à ceux du SaaS ». Pour justifier des multiples élevés, une entreprise IA doit non seulement prouver que ses utilisateurs paient, mais aussi que sa marge brute pondérée par l’usage peut continuer à s’améliorer.
Une chaîne de coûts de raisonnement derrière l’abonnement
La principale différence entre l’abonnement IA et le SaaS classique est que le coût marginal d’une utilisation unique n’est plus proche de zéro.
Dans le SaaS traditionnel, ouvrir un compte supplémentaire pour une équipe engendre des coûts de serveurs, support et bande passante, mais ces coûts ne croissent généralement pas linéairement avec chaque clic. Les coûts les plus importants concernent la R&D, la vente et l’acquisition. Une fois le produit mature, une partie significative des revenus additionnels peut rester en profit.
Les modèles de grande taille sont différents. Lorsqu’un utilisateur pose une question, le modèle génère une réponse — c’est le raisonnement, c’est-à-dire le calcul réel effectué lorsque le modèle est sollicité. Les tokens, unité de mesure de lecture/écriture du texte par le modèle, augmentent avec la quantité de questions, la longueur du contexte ou la complexité du contenu généré, consommant plus de tokens et de puissance de calcul.
Cela crée une contradiction entre un abonnement fixe et des coûts variables. Le prix de 20 dollars pour Claude Pro aux États-Unis dépend de la région, des taxes et des ajustements d’Anthropic. Les utilisateurs voient un prix fixe, mais le modèle doit faire face à des comportements d’usage très variés : certains se contentent d’envoyer des emails ou faire des recherches, d’autres traitent de longs documents, exécutent du code ou automatisent des processus complexes.
Le diagramme de décomposition populaire tente de concrétiser cela : dans 20 dollars, une partie revient au modèle, une autre aux fournisseurs de cloud et de calcul. Les coûts de calcul incluent l’électricité, la maintenance et l’amortissement des GPU. L’achat de GPU remonte ensuite à Nvidia, TSMC, fournisseurs de mémoire HBM, modules optiques, OEM et entreprises d’électricité.
L’« amortissement GPU » peut être compris comme le fait que des GPU coûteux ne sont pas amortis en une seule fois, mais répartis sur leur durée de vie, leur intensité d’utilisation ou selon des méthodes comptables. La répartition réelle dépend des quotas, du ratio d’utilisateurs intensifs, des prix internes des cloud, des remises sur la capacité réservée, du taux d’utilisation des GPU et de la durée d’amortissement. Le coût moyen n’est pas égal au coût marginal.
Ce que les investisseurs doivent vraiment surveiller, c’est la direction : une entreprise IA ne peut pas simplement divulguer la croissance de ses revenus, mais doit aussi montrer si ses coûts de calculs croissent en parallèle. Si l’usage s’étend plus vite que l’amélioration de l’efficacité du modèle, une marge brute plus élevée pourrait exercer une pression accrue sur la rentabilité. Seule une amélioration rapide de l’efficacité permettrait à l’entreprise de retrouver une structure de profit proche de celle du logiciel.
Les revenus d’infrastructure d’abord plus stables
Actuellement, la croissance de l’usage IA se traduit plus directement par une augmentation des investissements dans l’infrastructure que par une accumulation dans la couche applicative.
Que ce soit Claude, ChatGPT, Gemini ou des agents internes d’entreprise, le raisonnement doit finalement reposer sur la puissance de calcul, l’électricité, la mémoire et le réseau. La couche applicative peut changer de produit, mais les ressources sous-jacentes sont plus rigides. Tant que l’usage IA continue de croître, la dépense cloud, l’achat de GPU, la demande en HBM et la consommation électrique des centres de données augmenteront.
C’est aussi la raison pour laquelle Nvidia, TSMC, SK Hynix et autres acteurs de l’infrastructure sont constamment réévalués. Nvidia affiche une marge brute élevée, avec environ 71,1% en GAAP et 71,3% en non-GAAP pour FY2026, avec des prévisions trimestrielles également élevées. Bien que certains trimestres soient affectés par des coûts exceptionnels, les résultats publics ne peuvent pas toujours révéler la véritable marge des centres de données IA, mais la rareté de l’infrastructure confère un pouvoir de fixation des prix, déjà reflété dans les résultats.
Le HBM est un exemple clé dans cette chaîne. Il ne s’agit pas de mémoire ordinaire, mais d’un composant essentiel pour le calcul à haut débit dans les accélérateurs IA. Avec l’augmentation de la taille des modèles, de la longueur du contexte et des besoins en raisonnement simultané, la dépendance à la mémoire à haute bande passante s’accroît. Les estimations de la chaîne d’approvisionnement montrent que la part du coût du HBM dans la nouvelle génération de puces IA augmente, ce qui explique la revalorisation de SK Hynix, Samsung et Micron dans le cycle IA.
L’électricité et les centres de données passent aussi d’un coût de fond à une ligne d’investissement principale. La consommation d’énergie pour une requête simple n’est pas énorme, mais pour des agents complexes, des contextes longs, la génération de code ou des tâches multi-étapes, la consommation s’amplifie. Pour les fournisseurs cloud et opérateurs de centres de données, le vrai enjeu n’est pas la consommation d’une requête, mais la gestion de la charge, le prix de l’électricité, le refroidissement, la capacité des centres et l’accès au réseau électrique, qui deviennent des coûts et des goulots d’étranglement.
L’avantage de l’infrastructure réside dans la rapidité de validation des résultats. Les investissements cloud dans l’IA ont déjà commencé, tout comme les revenus et marges d’Nvidia, ainsi que les commandes et prix du HBM. La majorité des transactions dans la couche applicative concerne des attentes futures : conversion en abonnements, pénétration dans les entreprises, revenus API et la réduction des coûts futurs permettant de libérer des marges.
L’amélioration de l’efficacité reste la clé pour les haussiers
Les investisseurs en logiciels et en IA ne sont pas sans arguments. La principale thèse en faveur de l’efficacité est que, aujourd’hui, le coût de raisonnement élevé n’est qu’une phase initiale : l’optimisation des modèles, la mise en cache, les petits modèles, la conception de puces internes et une meilleure utilisation des clusters continueront à réduire le coût unitaire. Si la baisse de coûts est suffisante, les applications IA pourraient redevenir des logiciels à haute marge.
Ce contre-argument repose sur des bases concrètes. Certains modèles principaux ont déjà vu leur coût par token chuter de manière significative à capacité équivalente ou supérieure. OpenAI a révélé que le coût par token de GPT-4o mini a diminué de 99% par rapport à text-davinci-003 initial. La cadence varie selon les entreprises, Anthropic proposant récemment des versions à prix identique avec des modèles hiérarchisés, mais la tendance sectorielle reste celle d’une offre à moindre coût avec des capacités accrues.
Les entreprises de modèles ont aussi plusieurs moyens d’améliorer la rentabilité unitaire. Confier les tâches simples à de petits modèles, réutiliser la mise en cache pour les requêtes courantes, réserver les modèles plus puissants pour les contextes longs ou les tâches complexes. Les cloud providers développent leurs propres puces et optimisent la gestion des clusters pour réduire le coût unitaire. Google a ses TPU, Microsoft a Maia pour l’inférence, Amazon pousse Trainium et Inferentia.
Si l’on ne regarde que les progrès technologiques, la marge des applications IA peut encore s’améliorer. Des raisonneurs plus rapides, un meilleur routage des modèles, une compression accrue, permettent de supporter plus d’usage avec le même abonnement de 20 dollars. Les utilisateurs légers, les forfaits d’entreprises haut de gamme, la tarification API à plusieurs niveaux et des limites d’usage plus strictes peuvent aussi améliorer la rentabilité globale.
Le défi est que la baisse des coûts n’est pas le seul facteur. Les applications IA évoluent vers des charges de travail plus complexes. Hier, les utilisateurs se contentaient de questions-réponses ou de réécriture, mais aujourd’hui, la demande s’oriente vers des agents de code, la gestion de longs documents, la génération vidéo ou multimodale, l’automatisation d’entreprise. Ces scénarios ont une valeur et une consommation plus élevées. Plus le modèle est utile, plus l’utilisateur est susceptible de lui confier des tâches plus longues et complexes.
Les divergences deviennent plus concrètes : la vitesse de baisse du coût de raisonnement, peut-elle dépasser la croissance de l’usage et de la complexité des tâches ? Si le coût unitaire baisse rapidement mais que la consommation moyenne augmente plus vite, la marge pondérée du modèle restera sous pression. Inversement, si le routage, la mise en cache, la conception interne et la tarification à plusieurs niveaux sont efficaces, l’abonnement IA pourrait progressivement se libérer de ses caractéristiques coûteuses actuelles.
Les abonnements ne sont pas une marge brute
Le diagramme de décomposition de 20 dollars ne doit pas être considéré comme une fin en soi. Il sert plutôt d’alerte à l’évaluation dans la phase actuelle : lorsque le marché ne dispose pas encore de données transparentes sur la marge brute des entreprises IA, les investisseurs doivent faire une remise à l’hypothèse que « les revenus des applications IA sont intrinsèquement équivalents à ceux du SaaS ».
Pour des entreprises comme OpenAI ou Anthropic, non cotées, il est difficile pour les investisseurs externes d’accéder à une comptabilité complète. Les documents de financement, les divulgations des partenaires, la structure des coûts cloud, les prix des forfaits d’entreprise, la part des revenus API, et les limites d’usage, sont autant d’indices. La vraie donnée précieuse n’est pas le nombre d’utilisateurs payants, mais la répartition entre utilisateurs légers et intensifs, la volonté des clients d’entreprises de payer plus pour une utilisation intensive, la baisse des coûts cloud, et si le coût unitaire de raisonnement peut faire baisser la marge brute.
Les entreprises cotées verront leur vérification plus rapide dans les résultats financiers. La marge brute globale d’Nvidia, la croissance de ses revenus data center, la demande pour les processus avancés de TSMC, les prix et marges des fournisseurs de HBM, ainsi que l’intensité des investissements cloud, continueront à refléter si l’usage IA se déporte toujours vers l’infrastructure. Si ces indicateurs restent solides, mais que la marge des applications ne s’améliore pas, le marché continuera à valoriser plus fortement l’infrastructure.
Finalement, pour que les entreprises de modèles atteignent une valorisation plus élevée, elles doivent prouver que, même après une utilisation intensive, leurs abonnements génèrent encore suffisamment de marge. La prochaine divergence dans la tarification ne sera probablement pas dans le chiffre d’affaires annoncé, mais dans la capacité à faire baisser simultanément les coûts de raisonnement, les limites de forfaits et les prix pour les entreprises.
Cliquez pour découvrir les offres d’emploi de Rhythm BlockBeats
Rejoignez la communauté officielle de Rhythm BlockBeats :
Abonnement Telegram : https://t.me/theblockbeats
Groupe Telegram : https://t.me/BlockBeats_App
Compte Twitter officiel : https://twitter.com/BlockBeatsAsia