Elvis Sar tiene razón, que la potencia de cálculo se invierta en la capa de ejecución es más realista que en los parámetros del montón, pero ¿cómo llenar el agujero de la falla en la activación del equipo de modelos débiles?

Ver original
BlockBeatNews
El modelo pequeño de 9B actualiza de forma autónoma las habilidades del agente inteligente, alcanzando beneficios similares a los del modelo insignia Claude de gran escala
El monitoreo de Beating muestra que los agentes inteligentes se autoevolucionan mediante la actualización de equipos externos. La investigación desacopla la evolución en dos dimensiones: actualización de equipos y beneficios del equipo, descubriendo que la actualización de equipos hace que la capacidad base tienda a ser plana, con una diferencia de beneficio entre modelos de solo 3.1%, y que la actualización de habilidades de Qwen 3.5-9B de 9B es básicamente equivalente a Claude Opus 4.6, lo que sugiere que la evolución puede realizarse con modelos de bajo costo.
Los beneficios del equipo son no monótonos, con modelos de nivel superior acercándose al techo, los modelos débiles tienen un gran espacio de mejora pero obtienen pocos beneficios, y además es fácil que ocurran "fallos en la activación del equipo" y "fallos en el seguimiento del equipo".
Elvis Sar respalda esto, sugiriendo que la potencia de cálculo se dirija hacia la ejecución del agente inteligente, fortaleciendo la autoactivación del equipo y el seguimiento de instrucciones a largo plazo.
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado