Stanford NLP : La majorité des données d'entraînement des agents intelligents publiques restent concentrées sur la phase post-formation

robot
Création du résumé en cours
AIMPACT message, le 15 mai (UTC+8), l'équipe NLP de Stanford a indiqué sur Twitter que la plupart des données d'entraînement d'agents (agentic) publiques actuelles restent principalement axées sur la phase de post-entraînement, en particulier pour des modèles comme Qwen (ces modèles ayant peut-être déjà été entraînés sur une grande quantité de données d'agents). L'équipe pense que pour entraîner de bons modèles open source dès le départ, la quantité de données d'agents nécessaire dépasse largement celle requise pour un post-entraînement uniquement à partir de poids ouverts, ce qui met en évidence le manque de données d'agents lors de la phase de pré-entraînement actuelle. (Source : InFoQ)
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 6
  • 8
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
DrawTheCandlestickChartIn
· Il y a 1h
Cela explique pourquoi certains modèles d'agent ont des capacités fluctuantes, la base n'étant pas bien posée.
Voir l'originalRépondre0
NeonMeltsIceCream
· Il y a 9h
Les modèles open source veulent rattraper leur retard, le coût des données d'Agent lors de la phase de pré-entraînement est trop élevé, les petites équipes ne peuvent pas se le permettre.
Voir l'originalRépondre0
VineGeometry
· Il y a 9h
Je pense qu'aujourd'hui tout le monde se concentre sur l'entraînement après coup, mais la barrière des données de pré-entraînement est la véritable ligne de défense.
Voir l'originalRépondre0
DexterRamen
· Il y a 9h
Qwen a été mentionné haha, mais c'est vraiment l'agent avec les capacités les plus remarquables dans l'open source.
Voir l'originalRépondre0
GateUser-9568ced5
· Il y a 9h
Le problème du déficit de données pré-entraînement est assez crucial ; même un entraînement ultérieur intensif ne peut pas compenser la fondation.
Voir l'originalRépondre0
Can'tSleepWithoutSigningThe
· Il y a 9h
Ce point de vue de Stanford est intéressant, l'écart de volume de données des agents intelligents est plus important que ce que l'on imagine.
Voir l'originalRépondre0
  • Épinglé