A maioria das falhas de agentes que estou a ver não são “falhas de raciocínio”.


São falhas de roteamento de autoridade.
O modelo faz ações que o utilizador não autorizou:
- recomenda quando deveria perguntar
- planeja quando deveria bloquear
- compara quando deveria responder de forma restrita
- redige/execução quando lhe falta autoridade
- pede informações em falta, depois acrescenta uma árvore de decisão se/então de qualquer forma
Isto importa mais à medida que os agentes ganham acesso às ferramentas.
Respostas MCP: “O agente consegue aceder à ferramenta?”
Mas as empresas também precisam de saber:
“Foi o agente autorizado a fazer esse tipo de trabalho?”
Estou a chamar a isto emissão de primitivas de trabalho não autorizadas.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado