Notícias do site Coinjie, OneMillion\_AI publicou que o SkyRL de código aberto, que implementa uma pilha de treinamento concorrente, realizou uma auto-evolução de grandes modelos em questão de horas, com um aumento de 2,81 vezes na taxa de processamento geral de experimentos, e um aumento de aproximadamente 3,25 vezes na taxa de processamento dentro de um tempo absoluto por nó. Essa arquitetura mantém um modelo base compartilhado residente na memória da GPU, reduzindo o custo de inicialização fria ao recarregar modelos gigantes repetidamente, com o objetivo de ajudar os desenvolvedores a treinar dados de produção de grandes modelos em tempo real com um custo de memória extremamente baixo.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • 9
  • 3
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Wax-SealedPrivateKey
· 37m atrás
2,81 vezes de throughput, qual é a redução possível nos custos de treino?
Ver originalResponder0
FeeTakerPhD
· 22h atrás
Evolução automática em horas, parece que a agenda para AGI está a avançar novamente.
Ver originalResponder0
MempoolMaggie
· 22h atrás
Aumento de 3,25 vezes em um único nó, pequenas e médias equipes também podem usar grandes modelos
Ver originalResponder0
MevHasMeCompletelyConfused.
· 23h atrás
A otimização de memória de vídeo é sempre um ponto sensível, esta solução conseguiu atingir o ponto crucial.
Ver originalResponder0
SlowerThanBlock
· 23h atrás
Treinamento de dados de produção em tempo real, o espaço de imaginação para cenários de aplicação é muito grande
Ver originalResponder0
GateUser-2d7346e0
· 23h atrás
A ideia de design de base fixa é bastante engenhosa, evita operações de entrada/saída repetidas.
Ver originalResponder0
ExitLiquidityBuddy
· 23h atrás
O nome SkyRL é um pouco legal, o código foi open source? Pode fornecer o link?
Ver originalResponder0
GateUser-ad8b77bd
· 23h atrás
O treino de grandes modelos está a ser medido em horas, a velocidade de iteração é assustadora
Ver originalResponder0
Mirror-FinishTeacupWith
· 23h atrás
Código aberto + baixo custo de memória de vídeo, esta combinação é muito amigável para os desenvolvedores
Ver originalResponder0
Ver mais
  • Fixado