今日は一日中Codex自動化を走らせていました。


最大の感想:
エージェントの最も価値のある部分は、
すべての作業を自動で完了させることではなく、
途上のタスクの中で詰まっているものを、
次の明確なチェックポイントまで持ち上げて推進し続けることです。
今日は彼が行った作業の種類は以下の通りです:
1. コードを書けるものは、直接クリーンな作業ツリーに修正します。
例えば、ウィキコンパイラの誤判定バグを、
まずクリーンな作業ツリーで修正し、
検証に通ったら、
私の承認を得てメインリポジトリにcherry-pickします。
2. 検証可能なものは、証拠を直接更新します。
例えば、戦略のプリフライト、ウォッチアーティファクト、ダッシュボード、
これらは古いブロッカーを再検証し、
現在のゲートに書き戻します。
3. 私の決裁が必要なものは、ディシジョンカードを生成します。
例えば、KYCの提出をするか、
アフィリエイトの質問を公開追問するか、
汚れたリポジトリのウィンドウをクリアするか。
これが非常に重要です。
良いエージェントワークフローの核心は、
「全自動実行」ではありません。
核心は:
リスクの低い作業は継続的に推進し、
リスクの高い作業は止めて、
決定を一言で承認または拒否できる形に圧縮することです。
今日はいくつか落とし穴も踏みました:
汚れた作業ツリーはインテグレーションを詰まらせる;
長いログはコンテキストを圧迫する;
古いブロッカーの再更新はトークンの無駄遣い;
ランナーの不完全な終了は古いロックを残す。
そこで最終的に二層に改良しました:
常駐層:
15分ごとに軽くスキャンし、
新しいアーティファクト、ロック、ディシジョンキュー、タスクのタイムスタンプだけを見る。
深推層:
真のトリガーが発生した場合のみ、
タスクを選んでコミット、レポート、パーサー、ディシジョンカード、または待機サンプルに進める。
この仕組みを動かしてみると、
まるでジュニアPM+エンジニアのようです。
彼は私のプロダクト判断を代行しませんが、
バックログを継続的にクリアし、
曖昧な問題を明確な証拠に押し上げ、
潜在的な詰まりを顕在的な決定に変えます。
今ではますます思うのは:
未来の個人のワークフローの核心能力は、
「AIを使ってコードを書くことができるか」ではなく、
自分のタスクシステムを、
エージェントが継続的に推進できる形に設計できるかどうかです。
原文表示
post-image
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン留め