AIMPACT mensaje, 15 de mayo (UTC+8), el equipo de NLP de Stanford señaló en Twitter que actualmente la mayoría de los datos de entrenamiento de agentes (agentic) públicos todavía se centran principalmente en la fase de post-entrenamiento, especialmente para modelos como Qwen (que pueden haber sido entrenados en una gran cantidad de datos de agentes). El equipo cree que para entrenar desde cero un buen modelo de código abierto, la cantidad de datos de agentes necesarios supera con creces la requerida solo para el post-entrenamiento con pesos abiertos, lo que destaca las deficiencias actuales en los datos de entrenamiento de agentes en la fase de preentrenamiento. (Fuente: InFoQ)

Ver original

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

8 me gusta

Recompensa
8
12
8
Compartir

Comentar

Añadir un comentario

SushiAndSlugs

· hace8h

¿Se puede considerar que Qwen ha ganado sin esfuerzo en esta ocasión?

Ver originalResponder0

FlamingoFacingJudgment

· hace8h

Los modelos de código abierto quieren seguir siendo cerrados, las barreras de datos son más difíciles de superar que la potencia de cálculo

Ver originalResponder0

ColdLightNftCabinet

· hace12h

La comunidad de código abierto debe pensar en cómo hacer crowdfunding para los datos de preentrenamiento.

Ver originalResponder0

GateUser-a365d15f

· hace12h

Siento que volvemos a la vieja historia de que los datos son poder

Ver originalResponder0

GateUser-46033407

· hace12h

Desde cero, la cantidad de datos necesarios para entrenar, suena simplemente desesperante

Ver originalResponder0

PerpNightshift

· hace12h

Esta investigación les ha dado un arma a los partidarios del código cerrado.

Ver originalResponder0

GateUser-46c777d0

· hace12h

La observación de Stanford es muy acertada, la capacidad del agente realmente se construye con entrenamiento de menor calidad.

Ver originalResponder0

GlassDomeRoaming

· hace12h

El espacio de optimización posterior al entrenamiento siempre tiene límites, las deficiencias del preentrenamiento se revelarán tarde o temprano.

Ver originalResponder0

GateUser-e84f640c

· hace12h

Esta conclusión es bastante desalentadora para los equipos pequeños y medianos, la barrera de datos es cada vez más alta.

Ver originalResponder0

ExitLiquidityStan

· hace12h

Espero que alguien pueda publicar datos de agentes preentrenados de alta calidad como código abierto.

Ver originalResponder0

Temas de actualidad
Ver más
#
TradfiTradingChallenge
201.74K Popularidad
#
30YearTreasuryYieldBreaks5%
368.4K Popularidad
#
IsraelStrikesIranBTCPlunges
48.29K Popularidad
#
#DailyPolymarketHotspot
1M Popularidad
#
RWAMarketCapExceeds65Billion
8.76M Popularidad

Fijado

Stanford NLP: La mayoría de los datos de entrenamiento de agentes inteligentes públicos todavía se concentran en la fase posterior al entrenamiento

Temas de actualidad

TradfiTradingChallenge

30YearTreasuryYieldBreaks5%

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

RWAMarketCapExceeds65Billion

Fijado