Nous regarderons en arrière en 2026 comme l'âge d'or de l'intelligence subventionnée


Pour le même prix que Netflix, vous pouvez accéder presque illimitément aux modèles de pointe
Pour 200 $/mois, vous pouvez employer une armée d'agents pour construire ce que vous voulez
Et les entreprises obtiennent des offres préférentielles pour garantir la dépendance au fournisseur
Tout cela est subventionné par les investisseurs
Mais les tendances commencent à changer
Les laboratoires de pointe augmentent leurs prix (modestement, pour l'instant) et commencent à mettre des capacités avancées derrière des modèles de tarification basés sur l'utilisation
Plus ils approchent de l'après-IPO, plus ils doivent fixer leurs prix en fonction de la valeur, et non de l'adoption
Qu'est-ce que cela signifie ?
Pour les entreprises
Les entreprises intelligentes passeront plus agressivement à l'après-formation avec des modèles à poids ouverts
Les CFO qui ont permis à leurs organisations de maximiser les jetons voient des factures énormes et exigeront qu'ils deviennent plus intelligents dans la gestion des dépenses de jetons
Modal vient de lever $355m et a déclaré dans leur annonce :
« Ils ajustent finement avec leurs propres données, exécutent du RL, et ajustent l'inférence pour leurs propres besoins de latence, de débit et de coût »
Pourquoi ? Parce que les modèles à poids ouverts ont atteint des niveaux de qualité qui rendent cela possible
Ils continueront à utiliser énormément les modèles de pointe, mais pas TOUS les charges de travail
Il serait irresponsable pour une entreprise de ne pas explorer cette approche
Pour les consommateurs
Nous profiterons plus longtemps des avantages, mais avec des limitations croissantes
Vous pourrez toujours accéder à d'excellents modèles avec des plans d'environ 20 $/mois, mais :
> les crédits commenceront à s'épuiser plus rapidement
> les modèles ne fonctionneront pas aussi bien que ceux des plans basés sur l'utilisation (c'est-à-dire que vous recevrez des versions quantifiées et la qualité de performance privilégiera toujours les demandes basées sur l'utilisation)
> les capacités avancées ne seront accessibles que via des plans d'utilisation (par exemple, des fonctionnalités comme Claude Design, etc.)
Un petit pourcentage de consommateurs qui restent insensibles au prix continueront à utiliser le meilleur de tout, créant une fracture en matière d'intelligence
Pour les startups en IA
Si votre modèle économique implique une inférence empaquetée en tant que produit, vous devez planifier cela dès maintenant
Vos modèles de tarification devront évoluer
Et vous devez vous assurer que votre collecte de données peut permettre un post-formation sur des poids ouverts afin de ne pas dépendre uniquement des API des laboratoires de pointe
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé