今天跑了一整天 Codex automation。


最大的感受:
agent 最有价值的地方,
不是自动帮你做完所有事。
而是持续把一堆卡住的在途任务,
推进到下一个明确 checkpoint。
今天它做了几类事:
1. 能写代码的,直接进 clean worktree 修。
比如一个 wiki compiler 的误判 bug,
先在干净 worktree 修完,
验证通过后,
再经我批准 cherry-pick 回主仓。
2. 能验证的,直接刷新证据。
比如策略 preflight、watch artifacts、dashboard,
它会把旧 blocker 重新校验一遍,
然后写回当前 gate。
3. 需要我拍板的,生成 decision card。
比如是否提交 KYC,
是否公开追问 affiliate 问题,
是否清一个 dirty repo 窗口。
这点很关键。
一个好的 agent workflow,
核心不是“全自动执行”。
核心是:
低风险的它持续推进;
高风险的它停下来,
把决策压缩成一句我能批准或拒绝的话。
今天也踩了几个坑:
dirty worktree 会卡集成;
长日志会吃爆 context;
重复刷新旧 blocker 很浪费 token;
runner 退出不干净会留下 stale lock。
所以我最后把它改成两层:
常驻层:
每 15 分钟轻量扫一遍,
只看新 artifact、lock、decision queue、task timestamp。
深推层:
只有出现真实 trigger,
才选一个任务推进到 commit、report、parser、decision card 或 waiting sample。
这套东西跑下来,
更像一个 junior PM + engineer。
它不替我做产品判断,
但会持续清 backlog,
把模糊问题推成明确证据,
把隐性卡点推成显性决策。
我现在越来越觉得:
未来个人工作流的核心能力,
不是“会不会用 AI 写代码”。
而是你能不能把自己的任务系统,
设计成 agent 可以持续推进的形状。
post-image
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论