Kegagalan agen yang paling saya lihat bukanlah "kegagalan penalaran."


Mereka adalah kegagalan pengalihan otoritas.
Model memang bekerja, tetapi pengguna tidak mengizinkannya:
- merekomendasikan saat seharusnya bertanya
- merencanakan saat seharusnya memblokir
- membandingkan saat seharusnya menjawab secara sempit
- menyusun/dieksekusi saat tidak memiliki otoritas
- meminta info yang hilang, lalu menambahkan pohon keputusan if/then bagaimanapun
Ini menjadi lebih penting saat agen mendapatkan akses alat.
Jawaban MCP: "Bisakah agen mengakses alat tersebut?"
Tapi perusahaan juga perlu tahu:
"Apakah agen diizinkan melakukan jenis pekerjaan itu?"
Saya menyebut ini sebagai emisi primitive pekerjaan tidak sah.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan