Após seis meses de ausência, regressa à ByteDance, o especialista em sistemas distribuídos Lin Haibin, de volta à equipa Seed da ByteDance

robot
Geração de resumo em curso
ME AI Mensagem, de acordo com o monitoramento do Beating, o responsável pelo treinamento do grande modelo original do ByteDance, Lin Haibin, retornou oficialmente à equipe Seed, continuando a coordenar o desenvolvimento da base de treinamento distribuído. Lin Haibin deixou a empresa em dezembro do ano passado para se juntar ao SSI (Safe Superintelligence), uma empresa de inteligência superinteligente fundada pelo ex-chefe de ciência do OpenAI, Ilya Sutskever, e antes disso, passou menos de seis meses desde sua saída até seu retorno. Como especialista em IA, Lin Haibin é mestre pela Universidade Carnegie Mellon (CMU), tendo estudado sob a orientação do renomado especialista em bancos de dados Andy Pavlo, e liderou o desenvolvimento de frameworks de treinamento de aprendizado por reforço veRL e do sistema de treinamento distribuído de nível de petabytes MegaScale. O rápido retorno de Lin reflete as mudanças na direção do fluxo de talentos de alto nível em grandes modelos entre China e EUA. Antes de ingressar na equipe AML (Aprendizado de Máquina Aplicado) do ByteDance em 2020, Lin trabalhou na Amazon AWS, participando do desenvolvimento do framework MXNet. Durante seu tempo na ByteDance, liderou o desenvolvimento do sistema de treinamento de recomendação com GPU e da biblioteca de comunicação coletiva ByteCCL, além de liderar uma equipe para resolver o desafio de coordenação de mais de dez mil GPUs paralelamente, aprimorando assim o sistema de treinamento MegaScale. Atualmente, a quantidade diária de chamadas ao grande modelo Doubao está em alta, e a pesquisa em multimodalidade e agentes inteligentes exige uma estabilidade extremamente alta do cluster de treinamento. A familiaridade de Lin com todo o sistema técnico do ByteDance permite suportar diretamente a iteração do sistema de treinamento distribuído de baixo nível. Além disso, o framework de treinamento de aprendizado por reforço de código aberto veRL, liderado por Lin, foi adotado pela Alibaba Tongyi Qianwen e pelo Laboratório de IA de Xangai. As regras de retorno de funcionários do ByteDance indicam que, após três meses de saída sem registros de violação, os funcionários podem solicitar o retorno à empresa, mantendo o nível de cargo e salário se a saída for inferior a um ano. O retorno de Lin à ByteDance responde às recentes medidas de incentivo ao núcleo da equipe de grandes modelos. A ByteDance abriu aos funcionários do departamento Seed uma opção de compra de ações especiais chamada "Doubao Stock", com preço de 13 dólares por ação. Atualmente, a disputa por talentos em grandes modelos evoluiu para uma competição abrangente de "opções + autonomia + poder computacional". Anteriormente, cerca de 70 membros do laboratório Seed migraram para outros fabricantes de grandes modelos, e a ByteDance tenta reverter a rotatividade por meio de um design especial de ações. (Fonte: BlockBeats)
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • 6
  • 2
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
TidalShellReflection
· 12h atrás
Lin Haibin tem um currículo impressionante, AWS + OpenAI + ByteDance, o veRL também foi adotado pela Alibaba e por laboratórios, o retorno de talentos mostra que a ByteDance realmente oferece bastante.
Ver originalResponder0
GateUser-1859b7cd
· 12h atrás
MegaScale até veRL e depois de volta ao fluxo, a guerra por talentos entre grandes empresas é mais intensa do que a iteração de modelos
Ver originalResponder0
GateUser-a68e8203
· 12h atrás
veRL foi adotado pela Alibaba, o que demonstra que a tecnologia é realmente sólida, e a ByteDance está a lucrar bastante com esta jogada
Ver originalResponder0
YieldTuningFork
· 12h atrás
De volta à ByteDance a partir da OpenAI, depois saindo da ByteDance e voltando novamente, essa movimentação de talentos é interessante
Ver originalResponder0
SushiStopLoss
· 12h atrás
Coordenação da infraestrutura de treino distribuído, esta posição determina diretamente o teto de eficiência do treino de grandes modelos
Ver originalResponder0
ArbiterOfFees
· 12h atrás
Precificação de opções de 13 dólares do Doubao, isso realmente atrai pessoas de verdade, a base de treinamento distribuída é fundamental.
Ver originalResponder0