Augment Code实测AGENTS.md对代码生成的影响:最好的等于模型升级一档,最差的不如不写

robot
摘要生成中

ME News 消息,4 月 23 日(UTC+8),据 动察 Beating 监测,AI 编程工具公司 Augment Code 从自家 monorepo 中抽取数十份 AGENTS.md,用内部评测套件 AuggieBench 测量它们对编码 agent 产出的实际影响。做法是拿已合并的高质量 PR 当基准,让 agent 在有和没有 AGENTS.md 两种条件下重做同一任务,对比评分。 差距比预期大得多。写得最好的 AGENTS.md 带来的质量提升相当于把模型从 Haiku 换成 Opus,写得最差的还不如完全没有。而且同一份文件在不同任务上效果可以相反:它让一个 bug 修复的规范符合度升了 25%,却让同模块一个复杂功能的完成度掉了 30%。 管用的写法有几条:主文件控制在 100 到 150 行、配几份聚焦参考文档,在百来个核心文件的中等模块里能带来 10% 到 15% 的全面提升。把流程写成编号步骤效果最好,一个 6 步部署流程将漏文件的 PR 从 40% 砍到 10%,正确率升了 25%。用决策表帮 agent 在动手前选对方案,规范符合度也升了 25%。写禁令必须配替代方案,光写「不要」会让 agent 犹豫不决,15 条以上连续警告效果明显恶化。 最容易翻车的是文档太多。agent 一旦被拽进大量架构文档,加载几十万 token 之后产出反而变差。有个模块攒了 226 份文档超过 2MB,AGENTS.md 再好也没用。另外 AGENTS.md 是 agent 100% 会读的唯一文档位置,_docs/ 下没被引用的文档发现率不到 10%。 (来源:BlockBeats)

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论