Notícias do site Coinjie, OneMillion\_AI publicou que o SkyRL de código aberto, que implementa uma pilha de treinamento concorrente, realizou uma auto-evolução de grandes modelos em questão de horas, com um aumento de 2,81 vezes na taxa de processamento geral de experimentos, e um aumento de aproximadamente 3,25 vezes na taxa de processamento dentro de um tempo absoluto por nó. Essa arquitetura mantém um modelo base compartilhado residente na memória da GPU, reduzindo o custo de inicialização fria ao recarregar modelos gigantes repetidamente, com o objetivo de ajudar os desenvolvedores a treinar dados de produção de grandes modelos em tempo real com um custo de memória extremamente baixo.
CoinNetwork