Em 18 de junho, Noam Shazeer, um dos coautores do artigo do Transformer, anunciou no X que estava saindo para se juntar à OpenAI. Dois dias depois, John Jumper, ganhador do Prêmio Nobel de Química de 2024 e líder da equipe AlphaFold, também anunciou sua saída do Google DeepMind, indo para a Anthropic.

Duas notícias em sequência, grande reação do mercado de capitais: as ações da Alphabet, controladora do Google, chegaram a cair mais de 7%, evaporando mais de US$ 300 bilhões em valor de mercado. Várias agências de análise atribuíram essa liquidação à "fuga de talentos". Gil Luria, analista da D.A. Davidson, disse sem rodeios que a ida de Shazeer para a OpenAI e de Jumper para a Anthropic, com saídas praticamente simultâneas, fez o mercado temer que o Google esteja perdendo a guerra por talentos em IA.

A saída de Shazeer é especialmente digna de nota — esta já é a segunda vez que ele sai do Google.

Em 2021, insatisfeito por a empresa não querer lançar publicamente o chatbot que ele liderou, ele saiu para fundar a Character.AI; em agosto de 2024, o Google gastou cerca de US$ 2,7 bilhões para adquirir a licença da tecnologia da Character.AI, aproveitando para trazê-lo de volta ao DeepMind, nomeando-o vice-presidente de engenharia do projeto Gemini, co-liderando o projeto com Jeff Dean. Menos de dois anos depois, ele saiu novamente, desta vez para a rival OpenAI.

Até agora, todos os oito coautores do artigo «Attention Is All You Need», publicado há nove anos, deixaram o Google.

O usuário Tyler Maran fez um diagrama mostrando para onde cada um foi, que foi compartilhado loucamente nas redes sociais.

No entanto, esse diagrama pode ficar desatualizado em breve. Nos últimos dois dias, circularam rumores no mercado de que a NVIDIA está silenciosamente absorvendo a equipe central da Essential AI, incluindo Ashish Vaswani, coautor do artigo do Transformer e cofundador e CEO da Essential AI. Até o momento da publicação, nem a NVIDIA nem a Essential AI responderam oficialmente.

Aproveitando a oportunidade, vamos fazer um balanço completo da trajetória dessas oito pessoas, conhecidas como os "pais do Transformer", ao longo de nove anos, e seus verdadeiros destinos atuais.

É importante notar que a ordem dos autores do artigo «Attention Is All You Need» é aleatória. A nota de rodapé do artigo deixa claro: Todos os autores contribuíram igualmente, a ordem é aleatória, portanto não existe um "primeiro autor" ou "autor correspondente". Este artigo segue a ordem original de autoria do artigo, apresentando cada uma das oito pessoas.

«A origem de tudo»: oito googleanos desocupados

Para entender para onde foram hoje, precisamos voltar a 2017. Na época, a abordagem dominante em tradução automática era a Rede Neural Recorrente (RNN), que processava frases palavra por palavra em sequência, como fila indiana em uma via de mão única, sem paralelismo, lento e caro para treinar.

Oito pessoas do Google Brain decidiram tentar uma ideia quase audaciosa: jogar fora toda a estrutura recorrente, mantendo apenas o "mecanismo de atenção", permitindo que o modelo visse a frase inteira de uma vez, decidindo sozinho qual palavra merecia mais atenção. A frase «Attention Is All You Need» no título do artigo é uma adaptação dos Beatles «All You Need Is Love», e desde então se tornou um formato imitado por muitos títulos de artigos.

A declaração de contribuição dos autores do artigo registra brevemente o que cada um fez especificamente:

· Jakob Uszkoreit foi o primeiro a propor substituir a estrutura recorrente por autoatenção e liderou a validação inicial dessa ideia;

· Ashish Vaswani e Illia Polosukhin projetaram e implementaram juntos o modelo Transformer inicial, participando de praticamente todas as etapas do projeto;

· Noam Shazeer propôs a atenção por produto escalar, o mecanismo de atenção multi-cabeça e o método de representação posicional sem parâmetros, sendo outra pessoa que praticamente fez tudo;

· Niki Parmar projetou, implementou e depurou inúmeras variantes do modelo no repositório de código inicial e no framework tensor2tensor posterior;

· Llion Jones também testou muitas novas variantes de modelo e foi responsável pelo repositório de código inicial, otimização da eficiência de inferência e visualização;

· Łukasz Kaiser e Aidan N. Gomez passaram inúmeros dias e noites construindo os módulos do tensor2tensor, substituindo o repositório de código inicial, melhorando significativamente a eficiência dos resultados experimentais e da pesquisa.

Esta declaração também revela indiretamente um detalhe: embora a ordem de assinatura do artigo seja aleatória, Uszkoreit, Vaswani, Polosukhin e Shazeer claramente desempenharam papéis mais centrais no nível da arquitetura, enquanto Parmar, Jones, Kaiser e Gomez assumiram a liderança na implementação de engenharia e construção do sistema — isso também é uma nota inicial das diferenças de personalidade e especialização que mais tarde levariam cada um a seguir caminhos diferentes.

O próprio nome "Transformer" tem uma anedota. Uszkoreit gostava da pronúncia da palavra, então a equipe internamente se autodenominava "Team Transformer", e as primeiras capas dos documentos de design tinham seis personagens dos desenhos animados Transformers.

Desde a publicação do artigo, ele já foi citado mais de 260.000 vezes, sendo um dos artigos mais citados do século XXI.

Ashish Vaswani

Vaswani nasceu em 1986, indiano. Em 2002, obteve o bacharelado em Ciência da Computação pelo Birla Institute of Technology (BIT Mesra), na Índia. Depois foi para os EUA, cursou doutorado na University of Southern California com David Chiang, pesquisando tradução automática estatística e modelagem de linguagem com redes neurais. Após o doutorado, trabalhou como cientista da computação no Information Sciences Institute da USC por dois anos, e em 2016 entrou oficialmente no Google Brain como cientista pesquisador, onde ficou até 2021.

De acordo com a declaração de contribuição do artigo, Vaswani e Illia Polosukhin projetaram e implementaram juntos o modelo Transformer inicial, sendo uma das figuras centrais que "participou de praticamente todas as etapas do projeto".

Ao deixar o Google, Vaswani cofundou a Adept AI em 2021 com Niki Parmar e David Luan (ex-vice-presidente de engenharia da OpenAI), atuando como cientista-chefe, com o objetivo de criar "modelos de ação" capazes de operar autonomamente em qualquer software.

A Adept chegou a arrecadar mais de US$ 400 milhões, com valuation de cerca de US$ 1 bilhão, mas o produto não decolou e houve divergências internas. Vaswani e Parmar saíram cedo — seu mandato como cientista-chefe na Adept terminou em novembro de 2022.

No início de 2023, Vaswani e Parmar se uniram novamente para fundar a Essential AI, com ele como CEO. A empresa recebeu investimentos estratégicos do Google, NVIDIA e AMD: uma rodada seed de US$ 8,3 milhões liderada pela Thrive Capital, e uma Série A de US$ 56,5 milhões no final de 2023 liderada pela March Capital, com participação do Google, NVIDIA, AMD, KB Investment, Franklin Templeton, entre outros.

No início de 2026, a empresa concluiu uma rodada Série B de US$ 175 milhões, liderada pela Lightspeed Venture Partners com participação da Thrive Capital, atingindo valuation de US$ 1 bilhão, tornando-se oficialmente um unicórnio.

No final de 2025, a empresa lançou sua primeira série de modelos de código aberto, Rnj-1 (em homenagem ao matemático indiano Ramanujan).

No entanto, nos últimos dois dias, os ventos mudaram. Segundo relatos, a NVIDIA está recrutando a equipe central da Essential AI, incluindo o próprio Vaswani, que futuramente participará do desenvolvimento do modelo de código aberto da NVIDIA, o Nemotron.

Fontes revelam que o motivo é bastante realista: a Essential AI está enfrentando dificuldades de financiamento, e tirar Vaswani e sua equipe do campo da concorrente AMD (a AMD sempre foi uma das primeiras investidoras estratégicas da Essential AI, e a empresa dependia fortemente das GPUs da AMD) já é um negócio vantajoso.

Alguns pesquisadores da Essential AI (incluindo Alok Tripathy, Saurabh Srivastava) já atualizaram seus perfis no LinkedIn, indicando que ingressaram na NVIDIA. No entanto, até o momento, nem a NVIDIA nem a Essential AI confirmaram oficialmente essa notícia.

Noam Shazeer

Shazeer nasceu em 1976 na Filadélfia, é um judeu ortodoxo; seu pai, Dov Shazeer, era engenheiro formado em matemática; sua irmã foi ordenada rabina pelo Hebrew College. Desde jovem, demonstrou talento excepcional. Em 1994, representou os EUA na Olimpíada Internacional de Matemática, conquistando medalha de ouro perfeita. Depois, estudou matemática e ciência da computação na Duke University, foi bolsista do Angier B. Duke Memorial Scholarship e venceu a competição de matemática Putnam.

Em 2000, Shazeer entrou no Google, e seu primeiro grande feito foi corrigir o recurso de correção ortográfica da pesquisa do Google.

De acordo com a declaração de contribuição do artigo do Transformer, ele propôs a atenção por produto escalar, o mecanismo de atenção multi-cabeça e o método de representação posicional sem parâmetros, sendo, além de Vaswani e Polosukhin, outra pessoa que "participou de praticamente todos os detalhes".

Após coautorar o artigo do Transformer em 2017, ele e o colega Daniel De Freitas criaram o chatbot Meena, mas o Google, por cautela, não o lançou publicamente. Os dois saíram em 2021 e fundaram a Character.AI, que arrecadou mais de US$ 150 milhões de instituições como a a16z, tornando-se um popular aplicativo de chat de interpretação de papéis.

Em agosto de 2024, ocorreu uma reviravolta: o Google fechou um acordo de licenciamento com a Character.AI, supostamente no valor de US$ 2,7 bilhões. Shazeer e De Freitas, junto com um pequeno grupo de colegas, retornaram ao Google DeepMind. Ele foi nomeado vice-presidente de engenharia, co-liderando o projeto Gemini com Jeff Dean e Oriol Vinyals.

Como ele detinha cerca de 30% a 40% das ações da Character.AI, estima-se que ele tenha embolsado entre US$ 750 milhões e US$ 1 bilhão com o acordo. Em 2026, foi eleito membro da Academia Nacional de Engenharia dos EUA, com um currículo aparentemente em ascensão.

Mas apenas alguns meses depois, ele escolheu sair novamente, desta vez para a OpenAI, onde supostamente liderará uma área chamada "pesquisa de arquitetura", coincidindo com a janela da OpenAI para contratar para seu IPO (a empresa protocolou confidencialmente o formulário S-1 na SEC em 8 de junho, com valuation estimado em até US$ 852 bilhões).

O CEO da OpenAI, Sam Altman, declarou publicamente de forma rara: "Desde o primeiro dia da OpenAI, ele é uma das pessoas com quem mais queria trabalhar", e disse que essa contratação "foi planejada por dez anos".

Para o Google, é uma "recompra fracassada" de alto custo: a pessoa que trouxeram de volta por US$ 2,7 bilhões há dois anos agora foi para o maior concorrente, e isso foi um dos motivos diretos da queda acentuada das ações do Google esta semana.

Niki Parmar

Parmar nasceu em Pune, na Índia. Graduou-se no Pune Institute of Computer Technology em Tecnologia da Informação. Durante a faculdade, interessou-se por IA e aprendizado de máquina através de cursos online abertos de Andrew Ng e Peter Norvig. Depois, foi para os EUA fazer mestrado em Ciência da Computação na University of Southern California, pesquisando problemas de ciências sociais com métodos de aprendizado de máquina sob orientação do professor Morteza Dehghani.

Em 2015, Parmar entrou no Google Research como engenheira de software, e em 2017 foi para o Google Brain como engenheira de software de pesquisa — segundo relatos, era a pesquisadora mais jovem e a única sem doutorado na equipe do Google Brain na época.

De acordo com a declaração de contribuição do artigo, ela projetou, implementou e depurou inúmeras variantes do modelo no repositório de código inicial e no framework tensor2tensor posterior. Após a publicação do artigo, ela continuou a levar o Transformer para além da linguagem, participando de pesquisas que estenderam o mecanismo de autoatenção para geração de imagens e visão computacional.

Em 2021, Parmar deixou o Google e cofundou a Adept AI com Ashish Vaswani, David Luan e outros, atuando como CTO. Ela, assim como Vaswani, saiu cedo da Adept e, no início de 2023, cofundou a Essential AI com Vaswani, continuando como cofundadora.

Mas ela não esperou pela rodada Série B e pelo status de unicórnio da Essential AI. No final de 2024, Parmar saiu silenciosamente da Essential AI e se juntou à Anthropic, anunciando a notícia publicamente em fevereiro de 2025. Ela escreveu no X: "Hoje é um dia como outro qualquer para compartilhar: entrei na Anthropic em dezembro passado."

Ela posteriormente participou do desenvolvimento do Claude 3.7 Sonnet — um dos lançamentos de modelo mais importantes da história da Anthropic. Atualmente, é membro da equipe técnica (Member of Technical Staff) da Anthropic, focada em pesquisa de capacidades de ponta e aprendizado por reforço.

Duas coautoras que antes eram inseparáveis, parceiras em duas empreitadas, acabaram em destinos completamente diferentes: Parmar saiu discretamente mais de um ano antes, integrando-se calmamente a um laboratório de ponta; enquanto Vaswani continuou a impulsionar a Essential AI até que, esta semana, foi acolhido pelas mãos de um concorrente.

Jakob Uszkoreit

Uszkoreit nasceu em uma família de linguistas. Seu pai, Hans Uszkoreit, é um conhecido linguista computacional. Quando o filho propôs a hipótese de que "apenas o mecanismo de atenção é suficiente", até o pai duvidou. Uszkoreit obteve seu doutorado na Technische Universität Berlin e depois alcançou o nível de "Cientista Distinto" no Google Brain.

De acordo com a declaração de contribuição do artigo, foi Uszkoreit quem primeiro propôs substituir as redes neurais recorrentes pelo mecanismo de autoatenção e liderou a validação inicial dessa ideia — a semente dessa hipótese já estava plantada em seu artigo de 2016 "Modelo de Atenção Decomponível", coautorado com Ankur Parikh, Oscar Täckström e Dipanjan Das.

O nome "Transformer" também foi escolhido porque ele gostava da pronúncia; a equipe se autodenominava "Team Transformer", e as primeiras capas dos documentos de design tinham seis personagens dos Transformers.

No final de 2020, o AlphaFold2 do DeepMind provou que um modelo tipo Transformer poderia resolver o dobramento de proteínas, um "Santo Graal da biologia". Ele também percebeu cada vez mais claramente que o que faltava para o deep learning realmente transformar a biologia não era algoritmo, mas dados. "Isso se tornou quase uma obrigação moral", ele lembrou mais tarde.

Assim, em 2021, ele cofundou a Inceptive com Rhiju Das, professor de bioquímica da Universidade de Stanford e desenvolvedor do famoso jogo de design de RNA Eterna. A sede da empresa fica em Berkeley, a equipe de pesquisa em Berlim — ele mora em Berlim, e os funcionários estão distribuídos por Zurique, Londres, Vancouver e várias cidades da costa leste dos EUA.

A ideia central da empresa é fazer o experimento ao contrário: não treinar o modelo com dados existentes, mas gerar em larga escala novos dados experimentais de RNA usando robôs e humanos, e depois alimentar o modelo.

A Inceptive já arrecadou cerca de US$ 120 milhões de instituições como NVIDIA, a16z, Obvious Ventures e Section 32. O progresso mais recente ocorreu neste mês: no início de junho, a Alnylam Pharmaceuticals, pioneira em terapias de RNA de interferência, assinou uma parceria estratégica com a Inceptive para usar seus modelos de base para acelerar o design de candidatos a siRNA, com um pagamento inicial de US$ 30 milhões, e o valor total potencial do acordo é de cerca de US$ 2 bilhões, segundo relatos.

Uszkoreit disse em um comunicado: "A maioria dos designs de medicamentos ainda depende de tentativa e erro — testar milhares de moléculas e torcer para que uma funcione. A Inceptive parte de uma premissa diferente: a vida segue leis extremamente complexas que só a IA pode aprender."

Entre os oito autores, ele é o único que mudou completamente para a biotecnologia, e isso confirma uma previsão deixada pelo artigo na época: o potencial do mecanismo de atenção vai muito além da tradução automática.

Llion Jones

Jones é galês, formado pela University of Birmingham. Em 2011, entrou no Google como engenheiro de software, onde ficou por mais de dez anos. É um dos poucos entre os oito autores sem doutorado, que aprendeu o ofício puramente com intuição de engenharia.

De acordo com a declaração de contribuição do artigo, ele testou muitas novas variantes de modelo e foi responsável pelo repositório de código inicial, otimização da eficiência de inferência e visualização.

Ele lembrou mais tarde do momento decisivo: "Estávamos começando a cortar partes do modelo para ver quanto piorava. Para nossa surpresa, melhorou." Foi o primeiro momento em que a hipótese de que "a estrutura recorrente é redundante" foi verificada.

Em 2023, Jones e David Ha, também ex-Google, fundaram a Sakana AI em Tóquio. "Sakana" significa "peixe" em japonês. Ha é CEO, Jones é CTO, e outro cofundador, Ren Ito, é COO.

Jones agora mora em Tóquio, e se autodenomina "pesquisador de IA galês morando em Tóquio" nas redes sociais. A linha de pesquisa da empresa tem um forte sabor contracultural: em vez de acumular poder computacional e parâmetros, eles se inspiram na lógica da evolução natural, permitindo que um grupo de modelos menores colaborem como um cardume. Os resultados representativos da empresa incluem a Continuous Thought Machine e o projeto "AI Scientist", que pode realizar pesquisas ponta a ponta de forma autônoma.

Recentemente, a empresa lançou o modelo Sakana Fugu, de ponta.

A Sakana AI já arrecadou um total de US$ 379 milhões, incluindo uma rodada Série B concluída em março de 2026, com a Mitsubishi Electric como um dos investidores. Em março de 2026, a empresa também fechou um acordo plurianual com o Mitsubishi UFJ Financial Group (MUFG). O MUFG planeja usar a tecnologia da Sakana para reformar seus sistemas bancários. Segundo relatos, esse acordo pode tornar a empresa, avaliada em cerca de US$ 1,5 bilhão, lucrativa em um ano.

O próprio Jones expressou ceticismo em relação ao simples "scaling" em várias ocasiões.

Em março de 2026, em um evento interno do setor bancário, ele disse que a pesquisa atual em IA enfrenta uma realidade embaraçosa: muito investimento e talento entrando, o que teoricamente deveria gerar mais avanços, mas o efeito real pode ser o oposto: investidores pressionam por resultados, a concorrência incentiva a correria por primazia, e o espaço para "exploração livre" dos pesquisadores é comprimido.

Ele mencionou que a Sakana sempre manteve uma pequena parcela de liberdade de pesquisa "sem KPIs", porque o próximo avanço virá desse tipo de investimento de longo prazo sem se importar com consequências — exatamente como o Transformer nasceu naquela sala do Google Brain.

Ele também disse uma frase frequentemente citada: para que uma nova arquitetura realmente substitua o Transformer, não basta ser "melhor", tem que ser "visivelmente, inquestionavelmente melhor".

Aidan N. Gomez

Gomez é o mais novo dos oito autores. No ano da publicação do artigo, ele era apenas um estagiário de graduação de 20 anos no Google Brain, cursando dupla graduação em Ciência da Computação e Matemática na University of Toronto.

De acordo com a declaração de contribuição do artigo, ele e Łukasz Kaiser passaram inúmeros dias e noites construindo os módulos do framework tensor2tensor, substituindo o repositório de código inicial, melhorando significativamente a eficiência dos resultados experimentais e da pesquisa. "Eu só queria entender como o mecanismo de atenção funcionava", ele lembrou mais tarde, "nunca imaginei que se tornaria a 'arquitetura de tudo'". Depois do artigo, ele foi para a University of Oxford fazer doutorado, interrompeu para empreender e só obteve o título formalmente em 2024 — pode-se dizer que ele concluiu o doutorado enquanto empreendia.

Em 2019, Gomez, Ivan Zhang e Nick Frosst cofundaram a Cohere, posicionando-a como fornecedora de serviços de IA empresarial, evitando deliberadamente a guerra de chatbots de consumo, focando em privacidade de dados, implantação localizada e capacidade multilíngue, com clientes principalmente grandes empresas e governos.

Em 2023, Gomez foi selecionado pela revista Time como uma das 100 pessoas mais influentes em IA, e ele e os dois cofundadores também lideraram o ranking de pioneiros em tendências de IA da revista Maclean's naquele ano; em abril de 2025, foi eleito para o conselho da empresa de veículos elétricos Rivian.

Essa abordagem relativamente "não sexy" fez a empresa alcançar bons números financeiros: em meados de 2026, a receita anual recorrente da Cohere já ultrapassava US$ 200 milhões, crescendo 6 vezes no último ano, com margem bruta de cerca de 70%. O financiamento acumulado é de quase US$ 1,7 bilhão, com valuation de cerca de US$ 7 bilhões. Em agosto de 2025, a empresa contratou Francois Chadwick, que participou do IPO da Uber, como seu primeiro CFO, e já abriu uma janela para funcionários venderem ações no mercado secundário. Gomez disse várias vezes que o IPO está "próximo", mas até agora a empresa não protocolou o prospecto na SEC.

Gomez tem se tornado cada vez mais um porta-voz de IA no sentido geopolítico. Esta semana, ele escreveu um artigo na Fortune pedindo que os países enfrentem a questão da "soberania digital".

O artigo menciona diretamente o recente aperto no acesso ao modelo Anthropic, alertando os países para não "alugarem" seu futuro para algumas gigantes tecnológicas centralizadas, e propõe construir um ecossistema verdadeiramente diversificado, onde os países possam depender de diferentes fornecedores de IA, mantendo seus próprios valores, idiomas e sistemas legais.

Ele também afirmou publicamente que as preocupações com riscos existenciais "apocalípticos" da IA são exageradas, e que o risco real que mais o preocupa é a desinformação amplificada automaticamente nas redes sociais. Gomez agora não fala apenas sobre o modelo em si, mas sobre quem tem o direito de decidir que tipo de IA o mundo usará.

Łukasz Kaiser

Kaiser é polonês. Sua formação acadêmica inicial foi em lógica, teoria de autômatos, teoria de modelos algorítmicos e teoria dos jogos, áreas da ciência da computação teórica: obteve duplo mestrado em Matemática e Ciência da Computação pela University of Wrocław, e doutorado pela RWTH Aachen University. Depois, tornou-se professor titular no Centre National de la Recherche Scientifique (CNRS) e na Université Paris Diderot, focado em pesquisa pura em lógica e teoria de autômatos.

Mais tarde, ele se voltou para aplicações, trabalhou no Google Brain por quase 8 anos, período em que também foi coautor do TensorFlow e publicou artigos iniciais como "A memória ativa pode substituir a atenção?" com Samy Bengio, e "Algoritmo de aprendizado para Neural GPU" com Ilya Sutskever.

De acordo com a declaração de contribuição do artigo, ele e Aidan N. Gomez passaram inúmeros dias e noites construindo o framework tensor2tensor, melhorando significativamente a eficiência dos resultados experimentais e da pesquisa.

Entre os oito autores, ele é o único que não empreendeu, permanecendo sempre em grandes laboratórios fazendo pesquisa pura.

Em 2021, ele entrou na OpenAI, antes do lançamento do ChatGPT. Lá, participou do desenvolvimento do Codex (que mais tarde se tornou a base técnica do GitHub Copilot) e do benchmark de programação HumanEval, bem como da pesquisa do conjunto de dados de problemas matemáticos GSM8K. Esse trabalho mostrou cedo que "deixar o modelo pensar um pouco mais, amostrar várias vezes" poderia melhorar significativamente a precisão — esse foi o embrião do paradigma dos modelos de raciocínio.

Ele também é um dos autores assinantes do relatório técnico do GPT-4, e depois se tornou contribuidor central do primeiro modelo de raciocínio da OpenAI, o o1 (lançado em setembro de 2024), sendo considerado um papel de "líder de pesquisa", continuando até o o3 e paradigmas de raciocínio mais recentes, até a atual série GPT-5.

Recentemente, em um podcast MAD apresentado por Matt Turck, ele disse que o Transformer já foi provado matematicamente capaz de resolver qualquer problema, desde que o modelo possa gerar passos de raciocínio intermediários suficientes. De certa forma, é uma anotação tardia e mais precisa do artigo de nove anos atrás.

Illia Polosukhin

Polosukhin é de Kharkiv, Ucrânia. Sua graduação foi em Matemática Aplicada, e ele foi campeão do Concurso Internacional de Programação Universitária (ICPC). Segundo ele, aos dez anos, depois de assistir Matrix, desenvolveu um interesse quase obsessivo por inteligência artificial. Em 2014, entrou no Google, participando de pesquisas relacionadas ao TensorFlow, e também fez pesquisas em compreensão de leitura de máquina e sistemas de perguntas e respostas.

De acordo com a declaração de contribuição do artigo, ele e Ashish Vaswani projetaram e implementaram juntos o modelo Transformer inicial, sendo sua parte principal validar a eficácia dessa arquitetura em tarefas de tradução automática.

Após a publicação do artigo, em 2017, ele deixou o Google e cofundou com Alexander Skidanov uma empresa inicialmente chamada NEAR.AI, focada em inteligência artificial. Mas rapidamente perceberam que fazer infraestrutura descentralizada poderia ser mais interessante do que fazer modelos, então, por volta de 2018, a empresa se transformou no projeto blockchain NEAR Protocol.

O NEAR adotou uma tecnologia de sharding chamada Nightshade, e fornece uma camada 2 compatível com Ethereum através da Aurora. A mainnet foi lançada em 2020, e desde então a empresa arrecadou mais de US$ 530 milhões de instituições como a16z, Coinbase, Tiger Global Management, Hashed e Dragonfly Capital.

Polosukhin agora está tentando reunir suas duas identidades originais: em março de 2026, ele disse à mídia que "os futuros usuários do blockchain serão agentes de IA, não humanos", e posicionou o NEAR como a "camada de liquidação" da economia de agentes.

Em abril do mesmo ano, ele pediu publicamente a criação de um quadro regulatório mais completo para lidar com agentes de IA autônomos; ele acredita que as instituições e sistemas existentes não estão preparados para lidar com questões de responsabilidade e riscos sistêmicos trazidos por esses sistemas, pedindo mecanismos de responsabilização mais claros e supervisão "human-in-the-loop".

Ele atualmente mora em Portugal. Entre "ter escrito um artigo fundacional de LLM" e "gerir uma empresa de blockchain avaliada em dezenas de bilhões de dólares", ele é provavelmente a única pessoa no mundo que pode ter ambos.

Oito caminhos, continuando a explorar

Em março de 2024, na conferência GTC da NVIDIA, sete dos oito autores (Niki Parmar estava ausente) apareceram juntos pela primeira vez como grupo, em uma entrevista com Jensen Huang.

Huang disse: "Tudo o que desfrutamos hoje pode ser rastreado até aquele momento."

No final da conversa, ele deu a cada um uma placa comemorativa da NVIDIA DGX-1 com a inscrição "Você transformou o mundo" e uma assinatura. Em novembro do mesmo ano, a Fundação NEC C&C do Japão concedeu o Prêmio C&C daquele ano ao "Time Transformer" composto por essas oito pessoas, que dividiram o palco com três engenheiros veteranos que pesquisavam tecnologia de transmissão de cabos submarinos transoceânicos. Construtores de infraestrutura de dois campos completamente diferentes foram colocados no mesmo prêmio.

Nove anos depois, essas oito trajetórias de vida se espalharam para lugares onde quase não se cruzam mais: a pista de serviços empresariais do Vale do Silício, o laboratório de algoritmos evolucionários de Tóquio, a empresa de biologia molecular de Berlim, o protocolo blockchain de Portugal, e os principais laboratórios de IA que ainda estão se reorganizando esta semana.

Mas se juntarmos o que eles disseram ao longo dos anos, um julgamento comum se repete: ninguém realmente acredita que o Transformer será o ponto final.

Aidan N. Gomez disse que o mundo precisa de algo melhor que o Transformer; Llion Jones disse que a próxima arquitetura deve ser "visivelmente, inquestionavelmente melhor" para substituí-lo; Łukasz Kaiser ainda está tentando explicar, em linguagem matemática, até onde essa arquitetura nascida há nove anos pode levar a humanidade.

Talvez este seja o legado mais duradouro deixado por este artigo: seus oito autores estão espalhados pelo mundo, mas nenhum parou de procurar a próxima resposta.

Link original

Clique para saber as vagas abertas no BlockBeats

Bem-vindo ao grupo oficial do BlockBeats:

Telegram de inscrição: https://t.me/theblockbeats

Telegram de discussão: https://t.me/BlockBeats_App

Twitter oficial: https://twitter.com/BlockBeatsAsia

Ver original

Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.

Recompensa
curtir
Comentário
Repostar
Compartilhar

Comentário

Adicionar um comentário

Sem comentários

Tendências
Ver projetos
#
TradFiCFDGoldMaster
2,22M Popularidade
#
SaylorHintsAtMoreBTC
8,5M Popularidade
#
IsraelStrikesIranBTCPlunges
66,32K Popularidade
#
PredictWorldCupShare20000U
474,31K Popularidade
#
SolanaEcosystemANSEMSurges
21,96M Popularidade

Fixado

sitemap

Oito autores do Transformer nove anos depois: o Google não reteve nenhum.

«A origem de tudo»: oito googleanos desocupados

Ashish Vaswani

Noam Shazeer

Niki Parmar

Jakob Uszkoreit

Llion Jones

Aidan N. Gomez

Łukasz Kaiser

Illia Polosukhin

Oito caminhos, continuando a explorar

Tendências

TradFiCFDGoldMaster

SaylorHintsAtMoreBTC

IsraelStrikesIranBTCPlunges

PredictWorldCupShare20000U

SolanaEcosystemANSEMSurges

Fixado