AIMPACT message, le 15 mai (UTC+8), l'équipe NLP de Stanford a indiqué sur Twitter que la majorité des données d'entraînement d'agents (agentic) publiques actuelles restent principalement axées sur la phase de post-formation, en particulier pour des modèles comme Qwen (ces modèles ayant peut-être déjà été entraînés sur une grande quantité de données d'agents). L'équipe pense que pour former de bons modèles open source dès le départ, la quantité de données d'agents nécessaire dépasse largement celle requise pour un post-formation uniquement à partir de poids ouverts, ce qui met en évidence les insuffisances des données d'entraînement d'agents lors de la phase de pré-entraînement. (Source : InFoQ)

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

8 J'aime

Récompense
8
12
8
Partager

Commentaire

Ajouter un commentaire

SushiAndSlugs

· Il y a 3h

Qwen, est-ce que cette fois-ci on peut considérer ça comme une victoire facile ?

Voir l'originalRépondre0

FlamingoFacingJudgment

· Il y a 4h

Les modèles open source cherchent à devenir propriétaires, les barrières de données sont plus difficiles à franchir que la puissance de calcul.

Voir l'originalRépondre0

ColdLightNftCabinet

· Il y a 7h

La communauté open source doit réfléchir à comment financer la collecte de données pour l'entraînement préalable

Voir l'originalRépondre0

GateUser-a365d15f

· Il y a 7h

On a l'impression d'être revenu à la vieille histoire selon laquelle les données sont le pouvoir

Voir l'originalRépondre0

GateUser-46033407

· Il y a 7h

La quantité de données nécessaire pour former à partir de zéro, c'est tout simplement désespérant à entendre

Voir l'originalRépondre0

PerpNightshift

· Il y a 7h

Cette recherche a donné un coup de couteau aux partisans du logiciel propriétaire.

Voir l'originalRépondre0

GateUser-46c777d0

· Il y a 8h

Cette observation de Stanford est très pertinente, la capacité de l'agent dépend effectivement de l'entraînement en pile.

Voir l'originalRépondre0

GlassDomeRoaming

· Il y a 8h

Il y a toujours une limite à l'espace d'optimisation après entraînement, et les défauts de la pré-formation finiront par être révélés.

Voir l'originalRépondre0

GateUser-e84f640c

· Il y a 8h

Cette conclusion est un coup dur pour les petites et moyennes équipes, le seuil de données devient de plus en plus élevé.

Voir l'originalRépondre0

ExitLiquidityStan

· Il y a 8h

J'espère que quelqu'un pourra open source des données d'agents pré-entraînés de haute qualité

Voir l'originalRépondre0

Afficher plus

Sujets populaires
Afficher plus
#
TradfiTradingChallenge
199.69K Popularité
#
30YearTreasuryYieldBreaks5%
367.16K Popularité
#
IsraelStrikesIranBTCPlunges
48.28K Popularité
#
#DailyPolymarketHotspot
1M Popularité
#
RWAMarketCapExceeds65Billion
8.76M Popularité

Épinglé

Stanford NLP : La majorité des données d'entraînement des agents intelligents publiques restent concentrées sur la phase post-formation

Sujets populaires

TradfiTradingChallenge

30YearTreasuryYieldBreaks5%

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

RWAMarketCapExceeds65Billion

Épinglé