Anthropic fait fabriquer des puces AI par Samsung, l'histoire de la fonderie de Samsung a-t-elle un autre atout ?

Résumé
· Anthropic serait en train d'explorer la conception de ses propres puces serveur IA, mais aucune confirmation sur la conception, le prototypage ou le planning de production.
· OpenAI a déjà dévoilé sa puce d'inférence Jalapeño et a commencé les tests, avec un déploiement prévu d'ici fin 2026.
· Samsung pourrait bénéficier de la tendance à l'externalisation des puces IA, mais à court terme, Anthropic dépend toujours de la puissance de calcul d'AWS, Google et Nvidia.

Les discussions autour de la conception de ses propres puces serveur IA s'intensifient chez Anthropic, mais il ne s'agit pas encore d'une ligne de commande de puces déjà en production. Le cœur des préoccupations externes réside dans le coût d'inférence derrière Claude, l'approvisionnement en GPU, l'électricité des centres de données et la capacité des racks, qui deviennent des contraintes dures pour les grandes entreprises de modèles. OpenAI a déjà dévoilé sa puce d'inférence Jalapeño développée avec Broadcom, et Anthropic serait également en train d'évaluer des puces spécialisées mieux adaptées à ses propres modèles. Cependant, d'après les informations publiques actuelles, ni la participation de Samsung à la fabrication, ni le passage du projet à une conception formelle n'ont été confirmés.

Anthropic est encore en exploration précoce, pas à la veille de la production en masse

Les explorations d'Anthropic portent sur une puce serveur mieux adaptée au fonctionnement de ses propres modèles d'IA. Par rapport aux GPU génériques, si la puce sur mesure est bien conçue, elle pourrait réduire les coûts sur certaines tâches d'inférence, améliorer l'efficacité énergétique et réduire la dépendance vis-à-vis des fournisseurs de puces externes.

La difficulté de ce type de puce ne se limite pas aux performances d'une seule puce. Les entreprises de grands modèles doivent gérer simultanément la vitesse de calcul, la bande passante mémoire, les réseaux d'interconnexion, la consommation électrique, la dissipation thermique et la stabilité des clusters. Le véritable défi est de faire fonctionner des milliers de puces de manière stable et coordonnée dans un centre de données, au service continu de l'entraînement ou de l'inférence.

Actuellement, la description la plus prudente est qu'Anthropic en est encore à un stade précoce d'évaluation et de définition. Les questions suivantes n'ont toujours pas de réponse publique claire : quelles tâches IA la puce assumera-t-elle principalement ? Comment fixer les objectifs de performance et de consommation ? Comment l'adapter au niveau serveur et cluster ? Faut-il faire appel à des entreprises externes de conception de puces ?

La communication externe de l'entreprise reste également prudente. En avril, Anthropic a annoncé l'élargissement de sa collaboration avec Amazon, avec un investissement technique de plus de 100 milliards de dollars sur AWS pour la prochaine décennie, une réservation maximale de 5 GW de capacité, et a déclaré utiliser plus d'un million de puces Trainium2 pour entraîner et servir Claude. Anthropic insiste sur une stratégie matérielle diversifiée, mais AWS reste son principal fournisseur d'entraînement et de services cloud.

Cela signifie que même si l'exploration des puces sur mesure se poursuit, il est difficile à court terme de remplacer les fournisseurs existants. Les AWS Trainium, Google TPU et Nvidia GPU restent des composants essentiels de l'infrastructure de calcul à grande échelle d'Anthropic.

OpenAI a pris une longueur d'avance, la pression des coûts d'inférence est plus directe

Le fait qu'Anthropic soit aujourd'hui placé dans le débat sur les puces sur mesure a pour toile de fond importante qu'OpenAI a déjà donné une référence.

Selon l'annonce officielle de Broadcom, OpenAI et Broadcom ont dévoilé Jalapeño le 24 juin 2026, positionné comme un accélérateur pour l'inférence des grands modèles de langage, également appelé Intelligence Processor. OpenAI et Broadcom indiquent que cette puce a nécessité environ 9 mois de la conception initiale à la fabrication du prototype, que les échantillons techniques fonctionnent déjà en laboratoire, et que le déploiement est prévu d'ici fin 2026.

Il faut ici distinguer deux phases. Jalapeño a été dévoilé et est entré en test, mais cela ne signifie pas qu'il est déjà en commercialisation à grande échelle. Cela représente le début, pour les grandes entreprises de modèles, d'un contrôle plus profond des coûts d'inférence via le matériel, sans que les besoins en GPU ne soient immédiatement remplacés.

L'inférence est le processus de calcul par lequel un modèle génère une réponse après qu'un utilisateur a posé une question à ChatGPT, Claude, etc. Comparée à l'entraînement, l'inférence a lieu plus fréquemment et, à mesure que la base d'utilisateurs s'élargit, la pression sur les coûts augmente continuellement. Pour les entreprises de grands modèles, même une réduction infime du coût unitaire d'inférence, appliquée à des milliards de requêtes et aux dépenses à long terme des centres de données, peut se traduire par des économies considérables.

Le rythme d'Anthropic est nettement plus précoce. Il n'a pas publié de spécifications de puce, ni divulgué d'indicateurs de performance, de liste de partenaires ou de calendrier de production. Les progrès d'OpenAI montrent simplement une direction au marché : les entreprises de modèles les plus en pointe ne se contentent plus d'acheter des GPU, elles tentent également d'intégrer une partie de l'infrastructure de calcul sous leur propre contrôle.

Le potentiel de Samsung s'échauffe, mais aucune commande n'est confirmée

Si Samsung attire l'attention du marché, c'est parce qu'il possède à la fois des capacités de fabrication avancées et cherche à obtenir davantage d'opportunités de fonderie pour les puces IA. Après l'apparition d'informations sur le financement et les partenariats d'infrastructure d'Anthropic, le marché a naturellement associé Samsung à une opportunité potentielle de fabrication d'accélérateurs IA.

Mais il faut tempérer cette vision. Les informations publiques confirment que Samsung, SK Hynix, Micron et d'autres entreprises ont été mentionnées dans les discussions sur les partenaires d'infrastructure d'Anthropic. Micron a annoncé le 22 juin 2026 avoir conclu un accord stratégique avec Anthropic, incluant la conception d'architecture IA pour la mémoire et le stockage, des accords d'approvisionnement, l'adoption interne de Claude par Micron, et un investissement stratégique dans la Série H d'Anthropic.

Ces signaux de coopération ne peuvent pas être directement assimilés à une commande de puce sur mesure d'Anthropic à Samsung. Les affirmations selon lesquelles Anthropic aurait déjà contacté Samsung pour une collaboration en fabrication ne sont pas suffisamment étayées par des informations publiques vérifiables. Un jugement plus prudent serait que si le projet de puce sur mesure d'Anthropic progresse jusqu'à la phase de fabrication, Samsung pourrait devenir un participant potentiel suivi par le marché, mais on ne peut pas encore le présenter comme une transaction certaine.

Pour un projet de puce, de l'évaluation précoce à la production en série, il faut passer par la définition de l'architecture, la validation de la conception, le choix du procédé de fabrication, le test et l'assemblage, ainsi que la coordination de la chaîne d'approvisionnement. Tant que la conception de la puce n'est pas figée, le rôle de fonderie a du mal à être véritablement attribué.

Le recrutement renforce la crédibilité, mais la feuille de route reste indéterminée

Les mouvements de personnel renforcent l'attention portée au matériel d'Anthropic. Selon des rapports, Clive Chan, ancien membre de l'équipe de conception de puces sur mesure d'OpenAI, a rejoint Anthropic. Les informations publiques indiquent qu'il a participé à la création précoce de l'équipe puces d'OpenAI et a également une expérience chez Tesla Dojo. Anthropic a récemment intensifié le recrutement d'ingénieurs en conception de puces.

Cela montre au minimum que l'entreprise se prépare à développer des capacités matérielles. Pour une entreprise de modèles, une équipe matérielle qui comprend les modèles, les charges d'inférence et les systèmes de centres de données peut l'aider à déterminer quelles tâches confier à des puces sur mesure et lesquelles continuer à déléguer aux GPU, TPU ou puces des fournisseurs cloud.

Mais l'arrivée de talents et l'expansion des recrutements ne sont encore que des signaux d'investissement précoce. La suite du projet dépend de la capacité de la puce à offrir un avantage suffisant en termes de coût, performance, consommation et complexité de déploiement. Si la puce sur mesure ne fait qu'améliorer l'efficacité sur le papier, sans pouvoir fonctionner de manière stable à grande échelle, ou si les coûts de fabrication et d'adaptation logicielle sont trop élevés, l'entreprise pourrait continuer à dépendre principalement de puces externes.

C'est aussi la raison pour laquelle Nvidia est difficile à remplacer à court terme. Les GPU Nvidia restent la force motrice principale de l'entraînement et de l'inférence IA, avec un écosystème logiciel mature, et les clients de centres de données ont déjà construit massivement autour de sa plateforme. Les puces sur mesure seront plus susceptibles de prendre en charge une partie du travail dans des scénarios d'inférence spécifiques, plutôt que de remplacer complètement les GPU.

Pour les investisseurs, l'impact réel des discussions sur les puces sur mesure d'Anthropic ressemble à court terme davantage à un jeu de chaîne d'approvisionnement. Les grandes entreprises de modèles souhaitent obtenir davantage d'options de calcul ; les fournisseurs cloud, Broadcom, Samsung, TSMC, les fabricants de mémoire et la chaîne d'assemblage avancée pourraient tous bénéficier de cette tendance. Mais dans le cas d'Anthropic, les faits précis restent limités : l'exploration sur mesure est encore précoce, le rôle de Samsung n'est pas confirmé, et la puissance de calcul à grande échelle de Claude dépend toujours d'AWS, Google et Nvidia.

Cliquez pour connaître les postes à pourvoir chez BlockBeats

Bienvenue pour rejoindre la communauté officielle de BlockBeats :

Groupe d'abonnement Telegram : https://t.me/theblockbeats

Groupe de discussion Telegram : https://t.me/BlockBeats_App

Compte Twitter officiel : https://twitter.com/BlockBeatsAsia

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé