La mayoría de los fallos de los agentes que estoy viendo no son "fallos de razonamiento".


Son fallos en el enrutamiento de autoridad.
El modelo realiza acciones que el usuario no autorizó:
- recomienda cuando debería preguntar
- planea cuando debería bloquear
- compara cuando debería responder de manera específica
- redacta/ejecuta cuando no tiene autoridad
- pide información faltante, luego añade un árbol de decisiones condicionales de todos modos
Esto importa más a medida que los agentes obtienen acceso a herramientas.
Las respuestas de MCP: "¿Puede el agente acceder a la herramienta?"
Pero las empresas también necesitan saber:
"¿Fue el agente autorizado para ese tipo de trabajo?"
Estoy llamando a esto emisión de primitivas de trabajo no autorizadas.
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado