Stanford NLP: La mayoría de los datos de entrenamiento de agentes inteligentes públicos todavía se concentran en la fase posterior al entrenamiento

robot
Generación de resúmenes en curso
AIMPACT mensaje, 15 de mayo (UTC+8), el equipo de NLP de Stanford señaló en Twitter que actualmente la mayoría de los datos de entrenamiento de agentes (agentic) públicos todavía se centran principalmente en la fase de post-entrenamiento, especialmente para modelos como Qwen (que pueden haber sido entrenados en una gran cantidad de datos de agentes). El equipo cree que para entrenar desde cero un buen modelo de código abierto, la cantidad de datos de agentes necesarios supera con creces la requerida solo para el post-entrenamiento con pesos abiertos, lo que destaca las deficiencias actuales en los datos de entrenamiento de agentes en la fase de preentrenamiento. (Fuente: InFoQ)
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 5
  • 8
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
NeonMeltsIceCream
· hace4h
Los modelos de código abierto quieren ponerse al día, el costo de los datos del Agente en la fase de preentrenamiento es demasiado alto, los pequeños equipos no pueden permitírselo.
Ver originalResponder0
VineGeometry
· hace4h
Siento que ahora todos están compitiendo en el entrenamiento posterior, la barrera de datos de preentrenamiento es la verdadera línea defensiva.
Ver originalResponder0
DexterRamen
· hace4h
Qwen ha sido mencionado, jaja, pero en realidad es uno de los agentes con capacidades más destacadas en el código abierto.
Ver originalResponder0
GateUser-9568ced5
· hace4h
La brecha en los datos de preentrenamiento es bastante crucial; por más que se entrene después, no se puede reparar la base.
Ver originalResponder0
Can'tSleepWithoutSigningThe
· hace4h
La opinión de Stanford es interesante, la diferencia en la cantidad de datos de los agentes inteligentes es mayor de lo que se imaginaba.
Ver originalResponder0
  • Fijado