Stanford NLP : La majorité des données d'entraînement des agents intelligents publiques restent concentrées sur la phase post-formation

robot
Création du résumé en cours
AIMPACT message, le 15 mai (UTC+8), l'équipe NLP de Stanford a indiqué sur Twitter que la majorité des données d'entraînement d'agents (agentic) publiques actuelles restent principalement axées sur la phase de post-formation, en particulier pour des modèles comme Qwen (ces modèles ayant peut-être déjà été entraînés sur une grande quantité de données d'agents). L'équipe pense que pour former de bons modèles open source dès le départ, la quantité de données d'agents nécessaire dépasse largement celle requise pour un post-formation uniquement à partir de poids ouverts, ce qui met en évidence les insuffisances des données d'entraînement d'agents lors de la phase de pré-entraînement. (Source : InFoQ)
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 12
  • 8
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
SushiAndSlugs
· Il y a 3h
Qwen, est-ce que cette fois-ci on peut considérer ça comme une victoire facile ?
Voir l'originalRépondre0
FlamingoFacingJudgment
· Il y a 4h
Les modèles open source cherchent à devenir propriétaires, les barrières de données sont plus difficiles à franchir que la puissance de calcul.
Voir l'originalRépondre0
ColdLightNftCabinet
· Il y a 7h
La communauté open source doit réfléchir à comment financer la collecte de données pour l'entraînement préalable
Voir l'originalRépondre0
GateUser-a365d15f
· Il y a 7h
On a l'impression d'être revenu à la vieille histoire selon laquelle les données sont le pouvoir
Voir l'originalRépondre0
GateUser-46033407
· Il y a 7h
La quantité de données nécessaire pour former à partir de zéro, c'est tout simplement désespérant à entendre
Voir l'originalRépondre0
PerpNightshift
· Il y a 7h
Cette recherche a donné un coup de couteau aux partisans du logiciel propriétaire.
Voir l'originalRépondre0
GateUser-46c777d0
· Il y a 8h
Cette observation de Stanford est très pertinente, la capacité de l'agent dépend effectivement de l'entraînement en pile.
Voir l'originalRépondre0
GlassDomeRoaming
· Il y a 8h
Il y a toujours une limite à l'espace d'optimisation après entraînement, et les défauts de la pré-formation finiront par être révélés.
Voir l'originalRépondre0
GateUser-e84f640c
· Il y a 8h
Cette conclusion est un coup dur pour les petites et moyennes équipes, le seuil de données devient de plus en plus élevé.
Voir l'originalRépondre0
ExitLiquidityStan
· Il y a 8h
J'espère que quelqu'un pourra open source des données d'agents pré-entraînés de haute qualité
Voir l'originalRépondre0
Afficher plus
  • Épinglé