Entorno de agente inteligente de código abierto Prime Intellect que puede autoevolucionar: permite que la IA "lucha y coopera" generando más de 8000 herramientas de prueba

AIMPACT mensaje, 19 de mayo (UTC+8), según la monitorización de Dongcha Beating, Prime Intellect anunció la apertura del entorno de entrenamiento de agentes inteligentes general-agent, un entorno completamente sintético y autoevolutivo. La principal novedad de este lanzamiento es convertir la generación de tareas en un juego de dos jugadores: un sintetizador y un solucionador que se enfrentan por turnos, actualmente construyendo automáticamente una base de datos de estado grande que contiene 4504 tareas y más de 8000 herramientas únicas. Este marco comienza con tareas semilla simples y, mediante 9 estrategias como restricciones condicionales, instrucciones con ruido, acoplamiento entre entidades, divide las tareas en cinco niveles de dificultad de t0 a t4. El sintetizador diseña tareas con base de datos, herramientas de interacción y funciones de validación, mientras que el solucionador intenta completar las tareas. Solo las tareas con tasas de éxito dentro de un rango de dificultad específico se conservan, y el nivel más difícil se usa como semilla para la próxima fase de evolución. Las pruebas oficiales muestran que, solo con 4400 trayectorias sintetizadas en este entorno para ajustar un modelo de 30B de parámetros, la precisión en llamadas a herramientas en la prueba de referencia BFCL aumentó del 18.9% al 52.3%. Este mecanismo permite que el modelo se libere de la dependencia de conjuntos de datos estáticos anotados manualmente. A través de un juego directo entre modelos, el sistema puede generar continuamente datos de entrenamiento con dificultad controlada y validación semántica de forma automática. (Fuente: BlockBeats)
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado