O fundador do Transformer, Noam Shazeer, se despede novamente do Google para ingressar na OpenAI

robot
Geração do resumo em andamento

De acordo com o monitoramento Beating, o principal responsável pelo núcleo de IA do Google, gerente técnico do modelo Gemini Noam Shazeer deixou o Google novamente, ingressando oficialmente na concorrente OpenAI. Na quarta-feira desta semana, a OpenAI anunciou aos seus funcionários que, após sua chegada, Shazeer se concentrará em buscar uma nova arquitetura fundamental para grandes modelos e impulsionar a evolução da arquitetura Transformer.

Shazeer foi um dos coautores do artigo fundamental do Google de 2017, "Attention Is All You Need", que propôs a arquitetura Transformer, a base de modelos de IA generativa moderna como ChatGPT, Claude e Gemini. Ele ingressou no Google em 2000 e foi um dos engenheiros centrais mais antigos da empresa. Em 2021, por motivos de segurança e branding, o Google se recusou a lançar o chatbot Meena, desenvolvido por ele e Daniel De Freitas. Shazeer optou por deixar a empresa e cofundou a Character.AI.

Em agosto de 2024, para recontratar Shazeer, o Google firmou um acordo de licenciamento e aquisição tecnológica de até 2,7 bilhões de dólares com a Character.AI. Como fundador que detém aproximadamente 30% a 40% de participação na Character.AI, Shazeer liquidou pessoalmente entre 750 milhões e 1 bilhão de dólares. Após retornar ao Google, ele assumiu o cargo de vice-presidente e co-diretor técnico do Gemini, responsável principalmente pelo pré-treinamento do modelo. No entanto, menos de dois anos após o Google gastar uma fortuna para recrutá-lo, Shazeer decidiu sair novamente.

A contratação de Shazeer representa uma importante conquista na disputa por talentos na OpenAI, além de fazer a equipe do Gemini perder um de seus principais responsáveis técnicos. Atualmente, os grandes modelos estão atingindo o limite de expansão de poder computacional da arquitetura Transformer. A OpenAI colocou o criador original do Transformer à frente de uma busca por alternativas, com o objetivo de ganhar vantagem na próxima geração de arquiteturas de grandes modelos e enfrentar a concorrência da Anthropic e do Google.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado