A maioria das falhas de agentes que estou vendo não são "falhas de raciocínio".


São falhas de roteamento de autoridade.
O modelo faz algo que o usuário não autorizou:
- recomenda quando deveria perguntar
- planeja quando deveria bloquear
- compara quando deveria responder de forma restrita
- redige/executa quando não tem autoridade
- pede informações faltantes, depois adiciona uma árvore de decisão se/então de qualquer forma
Isso importa mais à medida que os agentes ganham acesso às ferramentas.
As respostas do MCP: "O agente pode acessar a ferramenta?"
Mas as empresas também precisam saber:
"Foi autorizado o agente a fazer esse tipo de trabalho?"
Estou chamando isso de emissão de primitivas de trabalho não autorizadas.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado