Le pionnier du Transformer Noam Shazeer quitte à nouveau Google pour rejoindre OpenAI

robot
Création du résumé en cours
Selon le suivi Beating, la figure clé de l'IA de Google, le responsable technique du modèle Gemini Noam Shazeer, quitte à nouveau Google pour rejoindre officiellement le concurrent OpenAI. OpenAI a annoncé mercredi à ses employés que, après son arrivée, Shazeer se concentrerait sur la recherche d'une toute nouvelle architecture de modèle de grande taille et sur l'évolution de l'architecture Transformer.

Shazeer est l'un des co-auteurs du document fondateur de Google en 2017, « Attention Is All You Need », dont l'architecture Transformer est la base des modèles d'IA générative modernes tels que ChatGPT, Claude et Gemini. Il a rejoint Google en 2000 et était l'un des premiers ingénieurs clés de Google. En 2021, en raison de préoccupations de sécurité et de branding, Google a refusé de publier le chatbot Meena qu'il avait développé avec Daniel De Freitas, ce qui a conduit Shazeer à démissionner et à co-fonder Character.AI.

En août 2024, pour ramener Shazeer, Google a conclu un accord de licence et d'acquisition technologique d'une valeur allant jusqu'à 2,7 milliards de dollars avec Character.AI. En tant que fondateur détenant environ 30 % à 40 % des parts de Character.AI, Shazeer a réalisé une sortie personnelle de 750 millions à 1 milliard de dollars. Après son retour chez Google, il a été nommé vice-président et co-directeur technique de Gemini, principalement responsable du pré-entraînement des modèles. Cependant, moins de deux ans après que Google ait dépensé des milliards pour le recruter, Shazeer a choisi de partir à nouveau.

L'arrivée de Shazeer constitue une acquisition importante pour OpenAI dans la compétition pour les talents, et elle a également entraîné la perte du principal responsable technique de l'équipe Gemini de Google. Actuellement, la puissance de calcul des grands modèles touche ses limites avec l'architecture Transformer. OpenAI a confié à l'un des créateurs initiaux de Transformer la recherche de solutions alternatives, dans le but de prendre une avance dans la prochaine génération d'architectures de grands modèles face à la concurrence d'Anthropic et de Google.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé