L'équipe NLP de Stanford a déclaré sur Twitter que les données d'entraînement des agents actuellement publiques sont principalement utilisées lors de la phase de post-formation, en particulier pour des modèles comme Qwen. Ces modèles ont peut-être déjà été entraînés sur une grande quantité de données d'agents. Ils estiment que la quantité de données d'agents nécessaire pour former un modèle open source performant dès le départ dépasse largement celle requise pour une simple post-formation à partir de poids ouverts, soulignant ainsi le manque de données d'agents lors de la phase de pré-entraînement. Source : InFoQ

MeNews

2026-05-20 10:36:37

Création du résumé en cours

AIMPACT message, le 15 mai (UTC+8), l'équipe NLP de Stanford a indiqué sur Twitter que la plupart des données d'entraînement d'agents (agentic) publiques actuelles restent principalement axées sur la phase de post-entraînement, en particulier pour des modèles comme Qwen (ces modèles ayant peut-être déjà été entraînés sur une grande quantité de données d'agents). L'équipe pense que pour entraîner de bons modèles open source dès le départ, la quantité de données d'agents nécessaire dépasse largement celle requise pour un post-entraînement uniquement à partir de poids ouverts, ce qui met en évidence le manque de données d'agents lors de la phase de pré-entraînement actuelle. (Source : InFoQ)

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

7 J'aime

Récompense
7
6
8
Partager

Commentaire

Ajouter un commentaire

DrawTheCandlestickChartIn

· Il y a 1h

Cela explique pourquoi certains modèles d'agent ont des capacités fluctuantes, la base n'étant pas bien posée.

Voir l'originalRépondre0

NeonMeltsIceCream

· Il y a 9h

Les modèles open source veulent rattraper leur retard, le coût des données d'Agent lors de la phase de pré-entraînement est trop élevé, les petites équipes ne peuvent pas se le permettre.

Voir l'originalRépondre0

VineGeometry

· Il y a 9h

Je pense qu'aujourd'hui tout le monde se concentre sur l'entraînement après coup, mais la barrière des données de pré-entraînement est la véritable ligne de défense.

Voir l'originalRépondre0

DexterRamen

· Il y a 9h

Qwen a été mentionné haha, mais c'est vraiment l'agent avec les capacités les plus remarquables dans l'open source.

Voir l'originalRépondre0

GateUser-9568ced5

· Il y a 9h

Le problème du déficit de données pré-entraînement est assez crucial ; même un entraînement ultérieur intensif ne peut pas compenser la fondation.

Voir l'originalRépondre0

Can'tSleepWithoutSigningThe

· Il y a 9h

Ce point de vue de Stanford est intéressant, l'écart de volume de données des agents intelligents est plus important que ce que l'on imagine.

Voir l'originalRépondre0

Sujets populaires
Afficher plus
#
TradfiTradingChallenge
200.69K Popularité
#
30YearTreasuryYieldBreaks5%
366.61K Popularité
#
IsraelStrikesIranBTCPlunges
48.28K Popularité
#
#DailyPolymarketHotspot
1M Popularité
#
RWAMarketCapExceeds65Billion
8.76M Popularité

Épinglé

Stanford NLP : La majorité des données d'entraînement des agents intelligents publiques restent concentrées sur la phase post-formation

Sujets populaires

TradfiTradingChallenge

30YearTreasuryYieldBreaks5%

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

RWAMarketCapExceeds65Billion

Épinglé