Notícias do site Coinjie, OneMillion\_AI publicou que o SkyRL de código aberto, uma pilha de treinamento paralelo, realizou uma evolução autônoma de grandes modelos em questão de horas, com um aumento de 2,81 vezes na taxa de processamento geral de experimentos, e uma melhoria de aproximadamente 3,25 vezes na taxa de processamento dentro de um tempo absoluto por nó. Essa arquitetura mantém uma base de modelo compartilhada residente na memória da GPU, reduzindo o custo de inicialização fria ao recarregar modelos gigantes repetidamente, com o objetivo de ajudar os desenvolvedores a treinar modelos grandes em tempo real com um custo de memória extremamente baixo.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • 9
  • 3
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Wax-SealedPrivateKey
· 20h atrás
2,81 vezes de capacidade de processamento, qual seria a redução no custo de treinamento?
Ver originalResponder0
FeeTakerPhD
· 05-31 03:15
Evolução própria em nível de horas, parece que a agenda para AGI está adiantando novamente
Ver originalResponder0
MempoolMaggie
· 05-31 03:13
Aumento de 3,25 vezes em um único nó, equipes pequenas e médias também podem usar grandes modelos
Ver originalResponder0
MevHasMeCompletelyConfused.
· 05-31 02:27
A otimização de memória de vídeo (VRAM) é sempre um ponto delicado, e esta solução conseguiu atingir o ponto crucial.
Ver originalResponder0
SlowerThanBlock
· 05-31 02:17
Treinamento de dados de produção em tempo real, o espaço de imaginação para cenários de aplicação é muito grande
Ver originalResponder0
GateUser-2d7346e0
· 05-31 02:15
A ideia de design de uma base fixa é bastante inteligente, evita operações de entrada/saída repetidas.
Ver originalResponder0
ExitLiquidityBuddy
· 05-31 02:14
O nome SkyRL é um pouco legal, o código foi aberto? Pode fornecer o link?
Ver originalResponder0
GateUser-ad8b77bd
· 05-31 02:12
O treinamento de grandes modelos está chegando a horas, a velocidade de iteração é assustadora
Ver originalResponder0
Mirror-FinishTeacupWith
· 05-31 02:11
Código aberto + baixo custo de memória de vídeo, essa combinação é muito amigável para os desenvolvedores
Ver originalResponder0
Ver projetos
  • Fixado