Anthropic négocie l'acquisition des puces d'inférence de la startup britannique Fractile, évaluée à 1 milliard de dollars

Selon Beating monitoring, Anthropic est en négociations avec la startup basée à Londres Fractile pour l'approvisionnement de ses puces d'inférence, qui devraient commencer la production de masse pour les centres de données dès l'année prochaine. Fondée à la fin de 2022, la solution principale de Fractile remplace la mémoire HBM (High Bandwidth Memory) dépendante des GPU par de la SRAM (Static Random Access Memory), réduisant les mouvements de données aller-retour entre la puce et le stockage externe, ce qui diminue la consommation d'énergie et les coûts d'inférence. Des approches similaires sont adoptées par Cerebras et Groq. L'accord en est encore à ses débuts, avec une échelle inconnue et la possibilité que les négociations échouent. Cependant, cette commande potentielle est devenue un argument de vente clé lors du dernier tour de financement de Fractile. Fractile cherche à lever plus de 100 millions de dollars avec une valorisation dépassant 1 milliard de dollars, avec Founders Fund, 8VC et Accel en discussion. Auparavant, Fractile n'avait levé que 15 millions de dollars, avec des investisseurs tels que Kindred Capital, NATO Innovation Fund et Oxford Science Enterprises. Anthropic a délibérément diversifié son approvisionnement en puces. La société a loué des serveurs cloud auprès de Google et Amazon, et l'automne dernier, elle a engagé 30 milliards de dollars pour louer des serveurs NVIDIA auprès de Microsoft Azure (NVIDIA investissant 10 milliards de dollars et Microsoft 5 milliards dans le cadre de l'accord). Récemment, Anthropic a également accepté d'acheter des puces développées en interne par Google pour une utilisation en dehors de Google Cloud. Reuters avait précédemment rapporté qu'Anthropic envisageait également de concevoir ses propres puces d'inférence, à l'image des stratégies employées par OpenAI et Meta. Les coûts d'inférence sont actuellement un point douloureux pour Anthropic. L'année dernière, la marge brute de l'activité d'inférence de l'entreprise est tombée en dessous des attentes internes, et la récente hausse de la demande pour Claude Code a entraîné une pénurie de puissance de calcul, certains utilisateurs subissant des throttling en période de pointe, ce qui a provoqué des protestations publiques de la part des développeurs. Le PDG de NVIDIA, Jensen Huang, a récemment exprimé ses regrets de ne pas avoir investi plus tôt dans Anthropic, estimant que cela aurait pu empêcher l'entreprise de se tourner massivement vers les puces de Google et Amazon.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé