O fundador do Transformer, Noam Shazeer, despede-se novamente do Google para juntar-se à OpenAI

robot
Geração de resumo em curso

De acordo com o monitoramento Beating, o principal responsável pela IA do Google, e o chefe técnico do modelo Gemini, Noam Shazeer, deixou novamente o Google, ingressando oficialmente na concorrente OpenAI. A OpenAI anunciou aos seus funcionários nesta quarta-feira que, após sua chegada, Shazeer se concentrará na busca por uma nova arquitetura fundamental para grandes modelos e impulsionará a evolução da arquitetura Transformer.

Shazeer foi um dos coautores do artigo fundamental do Google de 2017, "Attention Is All You Need", que propôs a arquitetura Transformer, a base de modelos modernos de IA generativa como ChatGPT, Claude e Gemini. Ele ingressou no Google em 2000, sendo um dos engenheiros centrais mais antigos da empresa. Em 2021, devido a considerações de segurança e marca, o Google recusou-se a lançar o chatbot Meena, desenvolvido por ele e Daniel De Freitas. Shazeer optou por deixar a empresa e cofundou a Character.AI.

Em agosto de 2024, para recontratar Shazeer, o Google firmou um acordo de licenciamento e aquisição tecnológica de até 2,7 bilhões de dólares com a Character.AI. Como fundador que detém aproximadamente 30% a 40% de participação na Character.AI, Shazeer liquidou pessoalmente entre 750 milhões e 1 bilhão de dólares. Após retornar ao Google, ele assumiu o cargo de vice-presidente e co-diretor técnico do Gemini, sendo responsável principalmente pelo pré-treinamento do modelo. No entanto, menos de dois anos após o Google gastar uma fortuna para recrutá-lo, Shazeer decidiu sair novamente.

A contratação de Shazeer representa uma importante conquista da OpenAI na disputa por talentos, além de fazer a equipe do Gemini perder um de seus principais responsáveis técnicos. Atualmente, os grandes modelos estão atingindo o limite de expansão computacional da arquitetura Transformer. A OpenAI, liderada pelo criador original do Transformer, busca alternativas para ganhar vantagem na próxima geração de arquiteturas de grandes modelos, enfrentando a concorrência da Anthropic e do Google.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado