我看到的大多数代理失败不是“推理失败”。


它们是权限路由失败。
模型执行了用户未授权的操作:
- 在应询问时直接推荐
- 在应阻止时进行计划
- 在应回答简洁时进行比较
- 在缺乏权限时草拟/执行
- 请求缺失的信息,然后仍然附加一个如果/那么的决策树
随着代理获得工具访问权限,这变得更为重要。
MCP回答:“代理能否访问该工具?”
但企业还需要知道:
“代理是否被授权执行那类工作?”
我将其称为未授权工作-原始发射。
查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论