La estrategia de externalizar el estado es bastante interesante, incluso los modelos pequeños pueden manejar búsquedas a largo plazo, vale la pena seguir la apertura de código de Harness-1.

Ver original
CoinNetwork
Noticias de CoinWorld, el agente de búsqueda inteligente 20B Harness-1 ha sido de código abierto, con investigadores de UIUC, UC Berkeley y Chroma.
El modelo utiliza una arquitectura de estado externo, delegando la memoria y organización del proceso de búsqueda al entorno, permitiendo que modelos no de vanguardia también puedan usar muy pocos datos de entrenamiento y alcanzar un rendimiento cercano a modelos de vanguardia en tareas de búsqueda a largo plazo.
Harness-1 en ocho benchmarks de búsqueda que cubren páginas web, finanzas, patentes y preguntas de múltiples saltos, alcanza una tasa de recuperación promedio de 0.730, 11.4 puntos porcentuales más alto que el sub-agente de búsqueda de código abierto de segundo mejor rendimiento, demostrando que la recuperación explícita de estado ayuda a que el modelo aprenda estrategias de búsqueda más transferibles.
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado