Stanford NLP: A maioria dos dados de treino de agentes inteligentes públicos ainda se concentra na fase pós-treino

robot
Geração de resumo em curso
AIMPACT mensagem, 15 de maio (UTC+8), a equipa de NLP de Stanford indicou no Twitter que, atualmente, a maioria dos dados de treino de agentes (agentic) públicos ainda se concentra principalmente na fase de pós-treino, especialmente para modelos como o Qwen (estes modelos podem já ter sido treinados com uma grande quantidade de dados de agentes). A equipa acredita que, para treinar do zero um bom modelo de código aberto, a quantidade de dados de agentes necessária é muito maior do que a requerida apenas para pós-treino a partir de pesos abertos, o que destaca as deficiências atuais dos dados de treino de agentes na fase de pré-treino. (Fonte: InFoQ)
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • 12
  • 8
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
SushiAndSlugs
· 8h atrás
Qwen esta jogada conta como uma vitória fácil?
Ver originalResponder0
FlamingoFacingJudgment
· 8h atrás
Modelos de código aberto querem seguir os fechados, barreiras de dados são mais difíceis de superar do que poder de processamento
Ver originalResponder0
ColdLightNftCabinet
· 12h atrás
A comunidade de código aberto precisa pensar em como fazer crowdfunding para os dados de pré-treinamento.
Ver originalResponder0
GateUser-a365d15f
· 12h atrás
Parece que estamos de volta à velha história de que os dados são poder.
Ver originalResponder0
GateUser-46033407
· 12h atrás
A quantidade de dados necessária para treinar do zero soa desesperadora só de ouvir
Ver originalResponder0
PerpNightshift
· 12h atrás
Esta pesquisa deu uma arma aos defensores do código fechado.
Ver originalResponder0
GateUser-46c777d0
· 12h atrás
A observação de Stanford é bastante precisa, a capacidade do agente realmente depende do treinamento em pilha.
Ver originalResponder0
GlassDomeRoaming
· 12h atrás
O espaço de otimização pós-treinamento sempre tem limites, as deficiências do pré-treinamento acabarão por ser expostas
Ver originalResponder0
GateUser-e84f640c
· 12h atrás
Esta conclusão é bastante desanimadora para equipas pequenas e médias, com os requisitos de dados a ficarem cada vez mais elevados.
Ver originalResponder0
ExitLiquidityStan
· 12h atrás
Espero que alguém possa disponibilizar dados de agentes pré-treinados de alta qualidade como código aberto
Ver originalResponder0
Ver mais
  • Fixado