L'IA devient beaucoup trop coûteuse et c'est la raison pour laquelle les marchés pourraient exploser MAIS pas par manque de demande - c'est tout le contraire :


> la demande pour l'IA explose. les modèles fonctionnent réellement mais les jetons sont trop chers.
je suis passé à Claude Fable 5 cette semaine et j'ai presque immédiatement atteint les limites d'utilisation
qui gagne ? modèles ouverts chinois. une fraction de la taille, 80-90 % des capacités de pointe, coûte 1/200e de Claude Fable, GPT 5.5 en haute.
ignorez les benchmarks btw, personne dans le monde réel ne s'en soucie vraiment, c'est la facture qu'ils doivent payer :
> le nombre de startups américaines déplaçant leurs abonnements Claude vers des modèles moins chers a triplé récemment.
des entreprises comme Uber commencent à substituer des modèles pour les mêmes tâches, en allouant des budgets moins chers
les goulots d'étranglement sont (oui, vous l'avez deviné !) le calcul, la puissance, la mémoire, le refroidissement, etc.
mon hypothèse est que la poussée vers des modèles moins chers forcera de nouvelles architectures de modèles et la conception de puces
la conception de puces mémoire d'Apple pour leur nouveau modèle de 20 milliards sur appareil est un exemple clair de cela.
graphique ci-dessous tiré du dernier rapport de Citadel :
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé