26%-54%错配率说明模型知道自己该干嘛却干不了,认知到行动的断层比想象中深

ME News
工具使用代理认知与行动脱节机制研究
该可解释性研究聚焦代理工具,揭示模型虽能识别应调用工具但实际调用失败,错配率达26%-54%。问题集中在认知到行动的转化阶段,非认知本身。内部信号可解码,但后层最终令牌机制导致信号旋转、与行动几乎正交。研究旨在预测干预效果,指出提示或训练不足等归因可能忽略后期层的几何结构,从而解释工具使用A/B测试的性能上限。
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论