AIMPACT mensagem, 15 de maio (UTC+8), a equipe de NLP de Stanford apontou no Twitter que, atualmente, a maioria dos dados de treinamento de agentes públicos ainda se concentra principalmente na fase de pós-treinamento, especialmente para modelos como Qwen (que podem já ter sido treinados em uma grande quantidade de dados de agentes). A equipe acredita que, para treinar um bom modelo de código aberto do zero, a quantidade de dados de agentes necessários é muito maior do que a exigida apenas para pós-treinamento a partir de pesos abertos, o que destaca as deficiências atuais dos dados de treinamento de agentes na fase de pré-treinamento. (Fonte: InFoQ)

Ver original

Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.

8 Curtidas

Recompensa
8
12
8
Compartilhar

Comentário

Adicionar um comentário

SushiAndSlugs

· 7h atrás

Qwen, essa rodada, pode ser considerada uma vitória fácil?

Ver originalResponder0

FlamingoFacingJudgment

· 8h atrás

Modelos de código aberto querem perseguir modelos fechados, barreiras de dados são mais difíceis de superar do que poder de processamento

Ver originalResponder0

ColdLightNftCabinet

· 11h atrás

A comunidade de código aberto precisa pensar em como fazer crowdfunding para os dados de pré-treinamento.

Ver originalResponder0

GateUser-a365d15f

· 11h atrás

Sinto que estamos de volta à velha história de que dados são poder

Ver originalResponder0

GateUser-46033407

· 11h atrás

A quantidade de dados necessária para treinar do zero soa simplesmente desesperadora

Ver originalResponder0

PerpNightshift

· 11h atrás

Esta pesquisa deu uma arma para os defensores do código fechado.

Ver originalResponder0

GateUser-46c777d0

· 11h atrás

A observação de Stanford é bastante precisa, a capacidade do agente realmente depende do treinamento em pilha posterior.

Ver originalResponder0

GlassDomeRoaming

· 11h atrás

O espaço de otimização pós-treinamento sempre tem limites, as deficiências do pré-treinamento acabarão sendo expostas.

Ver originalResponder0

GateUser-e84f640c

· 11h atrás

Essa conclusão é um golpe para equipes pequenas e médias, a barreira de dados está ficando cada vez mais alta.

Ver originalResponder0

ExitLiquidityStan

· 11h atrás

Espero que alguém possa abrir o código de dados de agentes pré-treinados de alta qualidade.

Ver originalResponder0

Ver projetos

Tendências
Ver projetos
#
TradfiTradingChallenge
201.33K Popularidade
#
30YearTreasuryYieldBreaks5%
368.25K Popularidade
#
IsraelStrikesIranBTCPlunges
48.29K Popularidade
#
#DailyPolymarketHotspot
1M Popularidade
#
RWAMarketCapExceeds65Billion
8.76M Popularidade

Fixado

sitemap

Stanford NLP: A maioria dos dados de treinamento de agentes inteligentes públicos ainda se concentra na fase pós-treinamento

Tendências

TradfiTradingChallenge

30YearTreasuryYieldBreaks5%

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

RWAMarketCapExceeds65Billion

Fixado