Mengapa Agen Anda Berhenti Berfungsi Setelah Beberapa Menit? Insinyur OpenAI: Itu Membutuhkan Papan Skor dan Memori Eksternal

robot
Pembuatan abstrak sedang berlangsung

Menurut pemantauan oleh Dongcha Beating, mode /goal Codex memungkinkan Agen untuk melakukan loop secara terus-menerus sampai tugas selesai, tetapi ini memperbesar kekurangan dari prompt manusia yang samar. Insinyur OpenAI Chris Hayduk menunjukkan dari pengalaman praktis internal bahwa instruksi yang samar seperti ‘mengoptimalkan kode’ dapat menyebabkan model menyerah terlalu cepat karena tidak mengetahui titik akhir, atau terjebak dalam loop modifikasi buta. Untuk memastikan Agen dapat bekerja secara stabil selama berhari-hari atau bahkan lebih lama, dia merangkum tiga disiplin: - Hilangkan istilah kualitatif dan ganti dengan daftar periksa: Model tidak dapat menilai apa yang ‘lebih baik,’ tetapi dapat memahami ‘mengurangi waktu sebesar 20% tanpa gagal pengujian.’ Ketika dihadapkan pada tugas kualitatif seperti formatasi makalah, dia bahkan langsung memberikan Codex sebuah daftar periksa Markdown yang berisi 200 persyaratan format, secara brutal mengubah tugas abstrak menjadi kuantitatif—‘menyelesaikan semua kotak centang berarti selesai.’ - Kurangi waktu validasi menjadi menit: Agen perlu memvalidasi tindakan melalui pengujian. Jangan biarkan ia berjalan selama berjam-jam di lingkungan produksi besar; sebaliknya, berikan dataset sampel dan kerangka kerja ringan agar umpan baliknya sesingkat mungkin. - Buat tiga file sebagai ‘otak eksternal’: Bahkan dengan jendela konteks yang besar, ia akan kehilangan memori setelah berjalan beberapa hari. Dia menyarankan langsung membuat tiga file Markdown secara lokal: PLAN.md (rencana makro), EXPERIMENTS.md (catatan eksperimen dan hasilnya), dan EXPERIMENT_NOTES.md (draf pemikiran waktu nyata), memaksa model untuk menulis proses coba-coba ke hard drive.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan