Urgence de la puissance de calcul : Google impose silencieusement une limite d'utilisation de Gemini à Meta

robot
Création du résumé en cours

Les contradictions entre l'offre et la demande d'infrastructures d'intelligence artificielle s'intensifient parmi les plus grandes entreprises technologiques mondiales. Selon des sources proches du dossier, Google a informé Meta vers mars dernier qu'il ne pouvait pas répondre à tous ses besoins en puissance de calcul pour Gemini, et a imposé une limite d'utilisation à ce géant des réseaux sociaux — même le plus grand fournisseur mondial de services d'IA peine à faire face à la demande torrentielle de puissance de calcul.

Selon le Financial Times britannique, ces restrictions n'ont toujours pas été levées à ce jour, ce qui a perturbé et retardé plusieurs projets internes d'IA chez Meta. Sous l'effet de cette situation, Meta a demandé à ses employés d'améliorer l'efficacité de l'utilisation de la puissance de calcul pour l'IA, en appliquant en interne une gestion rigoureuse des tokens d'IA. Google et Meta ont tous deux refusé de commenter.

Cette situation pousse Google à accélérer son expansion. Plus tôt ce mois-ci, Google a signé un accord de location de puissance de calcul de 920 millions de dollars par mois avec SpaceX, la société d'Elon Musk. Sundar Pichai, PDG de Google, a admis lors de la conférence sur les résultats du premier trimestre : « Récemment, nous avons rencontré des contraintes en matière de puissance de calcul. Si nous pouvions répondre à la demande, les revenus du cloud seraient plus élevés. »

Meta n'est pas un cas isolé. Plusieurs sources indiquent que d'autres clients professionnels de Google sont également soumis à des restrictions plus ou moins sévères, Meta étant le plus touché en raison de l'ampleur exceptionnelle de sa demande. Cette crise reflète la croissance explosive de la charge de travail d'inférence en IA, qui est devenue l'un des principaux défis de l'ensemble du secteur.

Les goulots d'étranglement de la puissance de calcul persistent, les grands clients en première ligne

Bien que les grandes entreprises technologiques aient déjà investi des dizaines de milliards de dollars dans les puces, les centres de données et l'approvisionnement en électricité, l'offre de puissance de calcul pour l'IA peine encore à suivre le rythme de la croissance de la demande.

Les revenus de l'activité cloud de Google au premier trimestre ont dépassé pour la première fois les 20 milliards de dollars, tandis que le carnet de commandes cloud signé mais non encore livré a presque doublé par rapport au trimestre précédent, dépassant les 460 milliards de dollars. Pichai a clairement indiqué que les contraintes de puissance de calcul persisteront à court terme.

Dans ce contexte, Meta est particulièrement touché. Selon des sources, ce sont précisément les besoins intenses des grands clients professionnels comme Meta qui ont directement poussé Google à accélérer la recherche de sources externes de puissance de calcul. Alors que les entreprises déploient à grande échelle des chatbots, des assistants de programmation et des agents d'IA, la charge de travail d'inférence — c'est-à-dire la puissance de calcul consommée lors de l'exécution de tâches dans les applications réelles après l'entraînement du modèle — devient le principal goulot d'étranglement du secteur.

Les projets internes de Meta entravés, accélération du virage vers les modèles propriétaires

Meta utilise largement Gemini en interne, couvrant la vérification de sécurité de la plateforme (y compris l'identification des contenus frauduleux, la suppression des informations nuisibles), le service client et les chatbots assistants publicitaires, ainsi que certains flux de travail internes et le développement de code, en complément d'autres modèles comme Claude d'Anthropic.

Selon des sources proches du dossier, Meta a initialement choisi Gemini car ses performances étaient supérieures à celles de son propre modèle open source Llama. Cependant, face au resserrement des limitations de puissance de calcul, Meta accélère sa migration vers ses modèles propriétaires. Plusieurs sources indiquent que Meta a récemment commencé à promouvoir en priorité son nouveau modèle Muse Spark, dont les performances seraient désormais comparables à celles de Gemini, contribuant ainsi à réduire la dépendance aux modèles externes.

Mark Zuckerberg, PDG de Meta, continue d'investir massivement dans les talents et les infrastructures en IA, visant à créer ce qu'il appelle une « superintelligence personnelle ». Contrairement à Google, Meta n'a pas d'activité cloud et accélère la construction de son propre réseau de centres de données, s'engageant à investir 600 milliards de dollars aux États-Unis d'ici 2028.

Google s'étend via SpaceX, l'industrie cherche des solutions

Face à la pression sur la puissance de calcul, Google a signé ce mois-ci un accord de location de puissance de calcul de 920 millions de dollars par mois avec SpaceX, afin de combler le déficit d'infrastructure. Le laboratoire d'IA Anthropic a conclu un accord similaire avec SpaceX le mois dernier.

Le fait que Google ait imposé des restrictions à Meta offre au public une rare fenêtre pour entrevoir la pression réelle à laquelle est confronté le plus grand fournisseur mondial de services d'IA dans la répartition de sa puissance de calcul. Actuellement, les goulets d'étranglement des infrastructures dans l'ensemble du secteur de l'IA s'étendent de l'entraînement à l'inférence, et la résolution de la contradiction entre l'offre et la demande dépend encore de la concrétisation d'une nouvelle vague d'investissements massifs en capital.

Avertissement sur les risques et clause de non-responsabilité

        Le marché comporte des risques, investissez avec prudence. Ce document ne constitue pas un conseil en investissement personnel et ne tient pas compte des objectifs d'investissement, de la situation financière ou des besoins spécifiques de chaque utilisateur. Les utilisateurs doivent déterminer si les opinions, points de vue ou conclusions exprimés dans ce document correspondent à leur situation particulière. Tout investissement effectué sur cette base relève de votre propre responsabilité.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire