Sonnet y Opus, emparejamiento de asesores para mejorar la tasa de éxito de las tareas del agente inteligente

robot
Generación de resúmenes en curso

ME News Noticias, 12 de abril (UTC+8), recientemente, una prueba sobre el rendimiento de agentes de IA mostró que, en la tarea de búsqueda de agentes (BrowseComp), emparejar el modelo Sonnet con el asesor Opus puede aumentar la tasa de éxito de la tarea del 58.1% al 60.4%. En la tarea de codificación en terminal (Terminal-Bench 2.0), el rendimiento aumentó del 59.6% al 63.4%. El artículo sugiere que esto puede deberse a que Opus proporciona una planificación estratégica altamente precisa para tareas difíciles. (Fuente: InFoQ)

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado