A equipa de NLP de Stanford no Twitter afirmou que os dados de treino de agentes atualmente disponíveis são principalmente utilizados na fase de pós-treino, especialmente para modelos como Qwen. Esses modelos podem já ter sido treinados em uma grande quantidade de dados de agentes. Eles acreditam que a quantidade de dados de agentes necessária para treinar do zero um modelo de código aberto de alta qualidade é muito maior do que a escala de pós-treino apenas com pesos abertos, destacando a insuficiência de dados de agentes na fase de pré-treino. Fonte: InFoQ

MeNews

2026-05-20 10:36:37

Geração de resumo em curso

AIMPACT mensagem, 15 de maio (UTC+8), a equipa de NLP de Stanford indicou no Twitter que, atualmente, a maioria dos dados de treino de agentes abertos ainda se concentra principalmente na fase de pós-treino, especialmente para modelos como o Qwen (estes modelos podem já ter sido treinados em uma grande quantidade de dados de agentes). A equipa acredita que, para treinar do zero um bom modelo de código aberto, a quantidade de dados de agentes necessária é muito maior do que a requerida apenas para pós-treino a partir de pesos abertos, o que destaca as deficiências atuais dos dados de treino de agentes na fase de pré-treino. (Fonte: InFoQ)

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.

7 gostos

Recompensa
7
5
8
Partilhar

Comentar

Adicionar um comentário

NeonMeltsIceCream

· 4h atrás

Modelos de código aberto querem alcançar, o custo de dados do Agente na fase de pré-treinamento é muito alto, equipes pequenas não podem pagar.

Ver originalResponder0

VineGeometry

· 4h atrás

Parece que agora todos estão focados em treinar após o ajuste, mas a barreira de dados de pré-treinamento é que realmente é a vantagem competitiva.

Ver originalResponder0

DexterRamen

· 4h atrás

Qwen foi mencionado, haha, mas de fato é uma das capacidades de agentes mais destacadas na open source.

Ver originalResponder0

GateUser-9568ced5

· 4h atrás

A questão da lacuna nos dados de pré-treinamento é bastante importante; por mais que o pós-treinamento seja forte, não consegue compensar a base.

Ver originalResponder0

Can'tSleepWithoutSigningThe

· 4h atrás

A perspetiva de Stanford é interessante, a diferença na escala de dados dos agentes inteligentes é maior do que se imagina.

Ver originalResponder0

Tópicos em destaque
Ver mais
#
TradfiTradingChallenge
193.05K Popularidade
#
30YearTreasuryYieldBreaks5%
363.88K Popularidade
#
IsraelStrikesIranBTCPlunges
48.28K Popularidade
#
#DailyPolymarketHotspot
1M Popularidade
#
RWAMarketCapExceeds65Billion
8.75M Popularidade

Fixado

Stanford NLP: A maioria dos dados de treino de agentes inteligentes públicos ainda se concentra na fase pós-treino

Tópicos em destaque

TradfiTradingChallenge

30YearTreasuryYieldBreaks5%

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

RWAMarketCapExceeds65Billion

Fixado