Stanford NLP: La mayoría de los datos de entrenamiento de agentes inteligentes públicos todavía se concentran en la fase posterior al entrenamiento

robot
Generación de resúmenes en curso
AIMPACT mensaje, 15 de mayo (UTC+8), el equipo de NLP de Stanford señaló en Twitter que actualmente la mayoría de los datos de entrenamiento de agentes (agentic) públicos todavía se centran principalmente en la fase de post-entrenamiento, especialmente para modelos como Qwen (que pueden haber sido entrenados en una gran cantidad de datos de agentes). El equipo cree que para entrenar desde cero un buen modelo de código abierto, la cantidad de datos de agentes necesarios supera con creces la requerida solo para el post-entrenamiento con pesos abiertos, lo que destaca las deficiencias actuales en los datos de entrenamiento de agentes en la fase de preentrenamiento. (Fuente: InFoQ)
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 12
  • 8
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
SushiAndSlugs
· hace8h
¿Se puede considerar que Qwen ha ganado sin esfuerzo en esta ocasión?
Ver originalResponder0
FlamingoFacingJudgment
· hace8h
Los modelos de código abierto quieren seguir siendo cerrados, las barreras de datos son más difíciles de superar que la potencia de cálculo
Ver originalResponder0
ColdLightNftCabinet
· hace12h
La comunidad de código abierto debe pensar en cómo hacer crowdfunding para los datos de preentrenamiento.
Ver originalResponder0
GateUser-a365d15f
· hace12h
Siento que volvemos a la vieja historia de que los datos son poder
Ver originalResponder0
GateUser-46033407
· hace12h
Desde cero, la cantidad de datos necesarios para entrenar, suena simplemente desesperante
Ver originalResponder0
PerpNightshift
· hace12h
Esta investigación les ha dado un arma a los partidarios del código cerrado.
Ver originalResponder0
GateUser-46c777d0
· hace12h
La observación de Stanford es muy acertada, la capacidad del agente realmente se construye con entrenamiento de menor calidad.
Ver originalResponder0
GlassDomeRoaming
· hace12h
El espacio de optimización posterior al entrenamiento siempre tiene límites, las deficiencias del preentrenamiento se revelarán tarde o temprano.
Ver originalResponder0
GateUser-e84f640c
· hace12h
Esta conclusión es bastante desalentadora para los equipos pequeños y medianos, la barrera de datos es cada vez más alta.
Ver originalResponder0
ExitLiquidityStan
· hace12h
Espero que alguien pueda publicar datos de agentes preentrenados de alta calidad como código abierto.
Ver originalResponder0
Ver más
  • Fijado