Stanford NLP: A maioria dos dados de treinamento de agentes inteligentes públicos ainda se concentra na fase pós-treinamento

robot
Geração do resumo em andamento
AIMPACT mensagem, 15 de maio (UTC+8), a equipe de NLP de Stanford apontou no Twitter que, atualmente, a maioria dos dados de treinamento de agentes públicos ainda se concentra principalmente na fase de pós-treinamento, especialmente para modelos como Qwen (que podem já ter sido treinados em uma grande quantidade de dados de agentes). A equipe acredita que, para treinar um bom modelo de código aberto do zero, a quantidade de dados de agentes necessários é muito maior do que a exigida apenas para pós-treinamento a partir de pesos abertos, o que destaca as deficiências atuais dos dados de treinamento de agentes na fase de pré-treinamento. (Fonte: InFoQ)
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • 12
  • 8
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
SushiAndSlugs
· 7h atrás
Qwen, essa rodada, pode ser considerada uma vitória fácil?
Ver originalResponder0
FlamingoFacingJudgment
· 8h atrás
Modelos de código aberto querem perseguir modelos fechados, barreiras de dados são mais difíceis de superar do que poder de processamento
Ver originalResponder0
ColdLightNftCabinet
· 11h atrás
A comunidade de código aberto precisa pensar em como fazer crowdfunding para os dados de pré-treinamento.
Ver originalResponder0
GateUser-a365d15f
· 11h atrás
Sinto que estamos de volta à velha história de que dados são poder
Ver originalResponder0
GateUser-46033407
· 11h atrás
A quantidade de dados necessária para treinar do zero soa simplesmente desesperadora
Ver originalResponder0
PerpNightshift
· 11h atrás
Esta pesquisa deu uma arma para os defensores do código fechado.
Ver originalResponder0
GateUser-46c777d0
· 11h atrás
A observação de Stanford é bastante precisa, a capacidade do agente realmente depende do treinamento em pilha posterior.
Ver originalResponder0
GlassDomeRoaming
· 11h atrás
O espaço de otimização pós-treinamento sempre tem limites, as deficiências do pré-treinamento acabarão sendo expostas.
Ver originalResponder0
GateUser-e84f640c
· 11h atrás
Essa conclusão é um golpe para equipes pequenas e médias, a barreira de dados está ficando cada vez mais alta.
Ver originalResponder0
ExitLiquidityStan
· 11h atrás
Espero que alguém possa abrir o código de dados de agentes pré-treinados de alta qualidade.
Ver originalResponder0
Ver projetos
  • Fixado