A equipa de NLP de Stanford no Twitter afirmou que os dados de treino de agentes atualmente disponíveis são principalmente utilizados na fase de pós-treino, especialmente para modelos como o Qwen. Esses modelos podem já ter sido treinados em uma grande quantidade de dados de agentes. Eles acreditam que a quantidade de dados de agentes necessária para treinar do zero um modelo de código aberto de alta qualidade é muito maior do que a escala de pós-treino apenas com pesos abertos, destacando a insuficiência de dados de agentes na fase de pré-treino. Fonte: InFoQ

MeNews

2026-05-20 10:53:07

Geração de resumo em curso

AIMPACT mensagem, 15 de maio (UTC+8), a equipa de NLP de Stanford indicou no Twitter que, atualmente, a maioria dos dados de treino de agentes (agentic) públicos ainda se concentra principalmente na fase de pós-treino, especialmente para modelos como o Qwen (estes modelos podem já ter sido treinados com uma grande quantidade de dados de agentes). A equipa acredita que, para treinar do zero um bom modelo de código aberto, a quantidade de dados de agentes necessária é muito maior do que a requerida apenas para pós-treino a partir de pesos abertos, o que destaca as deficiências atuais dos dados de treino de agentes na fase de pré-treino. (Fonte: InFoQ)

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.

8 gostos

Recompensa
8
12
8
Partilhar

Comentar

Adicionar um comentário

SushiAndSlugs

· 8h atrás

Qwen esta jogada conta como uma vitória fácil?

Ver originalResponder0

FlamingoFacingJudgment

· 8h atrás

Modelos de código aberto querem seguir os fechados, barreiras de dados são mais difíceis de superar do que poder de processamento

Ver originalResponder0

ColdLightNftCabinet

· 12h atrás

A comunidade de código aberto precisa pensar em como fazer crowdfunding para os dados de pré-treinamento.

Ver originalResponder0

GateUser-a365d15f

· 12h atrás

Parece que estamos de volta à velha história de que os dados são poder.

Ver originalResponder0

GateUser-46033407

· 12h atrás

A quantidade de dados necessária para treinar do zero soa desesperadora só de ouvir

Ver originalResponder0

PerpNightshift

· 12h atrás

Esta pesquisa deu uma arma aos defensores do código fechado.

Ver originalResponder0

GateUser-46c777d0

· 12h atrás

A observação de Stanford é bastante precisa, a capacidade do agente realmente depende do treinamento em pilha.

Ver originalResponder0

GlassDomeRoaming

· 12h atrás

O espaço de otimização pós-treinamento sempre tem limites, as deficiências do pré-treinamento acabarão por ser expostas

Ver originalResponder0

GateUser-e84f640c

· 12h atrás

Esta conclusão é bastante desanimadora para equipas pequenas e médias, com os requisitos de dados a ficarem cada vez mais elevados.

Ver originalResponder0

ExitLiquidityStan

· 12h atrás

Espero que alguém possa disponibilizar dados de agentes pré-treinados de alta qualidade como código aberto

Ver originalResponder0

Ver mais

Tópicos em destaque
Ver mais
#
TradfiTradingChallenge
201.74K Popularidade
#
30YearTreasuryYieldBreaks5%
368.4K Popularidade
#
IsraelStrikesIranBTCPlunges
48.29K Popularidade
#
#DailyPolymarketHotspot
1M Popularidade
#
RWAMarketCapExceeds65Billion
8.76M Popularidade

Fixado

Stanford NLP: A maioria dos dados de treino de agentes inteligentes públicos ainda se concentra na fase pós-treino

Tópicos em destaque

TradfiTradingChallenge

30YearTreasuryYieldBreaks5%

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

RWAMarketCapExceeds65Billion

Fixado