Pour faire évoluer la communauté open source, il faut trouver des moyens d'obtenir ou de synthétiser davantage de données de pré-entraînement au niveau des agents intelligents.

Voir l'original
MeNews
Stanford NLP : La majorité des données d'entraînement des agents intelligents publiques restent concentrées sur la phase post-formation
L'équipe NLP de Stanford a déclaré sur Twitter que les données d'entraînement des agents actuellement publiques sont principalement utilisées lors de la phase de post-formation, en particulier pour des modèles comme Qwen. Ces modèles ont peut-être déjà été entraînés sur une grande quantité de données d'agents. Ils estiment que la quantité de données d'agents nécessaire pour former un modèle open source performant dès le départ dépasse largement celle requise pour une simple post-formation à partir de poids ouverts, soulignant ainsi le manque de données d'agents lors de la phase de pré-entraînement. Source : InFoQ
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé