Publicación de la prueba de referencia de tareas prolongadas basada en el historial de navegación real

AIMPACT mensaje, 30 de abril (UTC+8), Dan Fried anunció en la plataforma X que su equipo ha desarrollado una prueba de referencia basada en el historial de navegación real de los usuarios, que incluye aproximadamente 200 tareas multisitio, con el objetivo de evaluar la tasa de éxito y la eficiencia de los agentes en tareas de larga duración (muchas de las cuales requieren varias horas para resolverse). El artículo relacionado ya ha sido publicado, liderado por Lawrence K. y otros. Este trabajo se centra en la evaluación del rendimiento de los agentes en tareas web complejas y de largo plazo. (Fuente: InFoQ)

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado