Stanford NLP: A maioria dos dados de treino de agentes inteligentes públicos ainda se concentra na fase pós-treino

robot
Geração de resumo em curso
AIMPACT mensagem, 15 de maio (UTC+8), a equipa de NLP de Stanford indicou no Twitter que, atualmente, a maioria dos dados de treino de agentes abertos ainda se concentra principalmente na fase de pós-treino, especialmente para modelos como o Qwen (estes modelos podem já ter sido treinados em uma grande quantidade de dados de agentes). A equipa acredita que, para treinar do zero um bom modelo de código aberto, a quantidade de dados de agentes necessária é muito maior do que a requerida apenas para pós-treino a partir de pesos abertos, o que destaca as deficiências atuais dos dados de treino de agentes na fase de pré-treino. (Fonte: InFoQ)
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • 5
  • 8
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
NeonMeltsIceCream
· 4h atrás
Modelos de código aberto querem alcançar, o custo de dados do Agente na fase de pré-treinamento é muito alto, equipes pequenas não podem pagar.
Ver originalResponder0
VineGeometry
· 4h atrás
Parece que agora todos estão focados em treinar após o ajuste, mas a barreira de dados de pré-treinamento é que realmente é a vantagem competitiva.
Ver originalResponder0
DexterRamen
· 4h atrás
Qwen foi mencionado, haha, mas de fato é uma das capacidades de agentes mais destacadas na open source.
Ver originalResponder0
GateUser-9568ced5
· 4h atrás
A questão da lacuna nos dados de pré-treinamento é bastante importante; por mais que o pós-treinamento seja forte, não consegue compensar a base.
Ver originalResponder0
Can'tSleepWithoutSigningThe
· 4h atrás
A perspetiva de Stanford é interessante, a diferença na escala de dados dos agentes inteligentes é maior do que se imagina.
Ver originalResponder0
  • Fixado