"Skill" agen cerdas: diskusi hangat, penggunaan nyata hampir nol

robot
Pembuatan abstrak sedang berlangsung

Headline

Keterampilan Agen Cerdas: Insinyur AI Menyebutkan Kritikan Terhadap Hype Ini

Summary

Insinyur AI Dax Raad dari OpenCode dan SST baru-baru ini mengirimkan sebuah pos, mengungkapkan fakta yang canggung: modul “keterampilan” yang digunakan untuk memperluas kemampuan agen cerdas, meskipun telah melahirkan berbagai standar, alat pendukung, dan diskusi yang tiada henti, namun sebagian besar pengguna sama sekali belum menginstal satu pun. Dia menyerukan industri untuk tenang: banyak ide yang akhirnya tidak terwujud, semangat tanpa bukti pendukung hanya membakar uang. Pernyataan ini langsung mengenai inti masalah di lingkaran alat AI—pencipta dan pengguna produk tidak berada di jalur yang sama.

Analysis

  • Latar belakang: Raad telah bekerja pada alat pemrograman AI seperti OpenCode, dan selalu berani mengungkapkan masalah “overbuilding” di bidang awan dan AI.
  • Apa yang dimaksud dengan ekosistem “keterampilan”:
    • Proposal titik akhir yang dapat ditemukan oleh Cloudflare (/.well-known/skills)
    • Struktur direktori .agents/skills yang disepakati dalam kerangka kerja seperti Claude Code dan LangChain
  • Hal-hal ini pada awalnya dimaksudkan dengan baik: untuk membuat kemampuan agen menjadi modular dan dapat saling beroperasi. Namun tingkat adopsi sebenarnya sangat rendah, alasannya juga tidak rumit:
    • Sulit untuk diimplementasikan, biaya pelaksanaan tinggi;
    • Tumpang tindih dengan fitur perintah kustom yang ada, tidak jelas berapa banyak nilai baru yang bisa dihadirkan.
  • Ini sebenarnya adalah masalah lama di lingkaran alat AI: pertama-tama bangun infrastruktur, kebutuhan akan dibahas kemudian. Di komunitas memang ada yang mengatakan bahwa “keterampilan” dapat meningkatkan tingkat keberhasilan tugas, tetapi yang benar-benar menggunakannya sangat sedikit.
  • Raad memiliki lebih dari 120 ribu pengikut di media sosial, suara skeptis seperti ini mudah untuk diperbesar. Mungkin bisa mendorong beberapa tim untuk kembali ke kenyataan, terlebih dahulu melihat apakah ada yang benar-benar membutuhkan hal ini, sebelum memutuskan untuk terus berinvestasi.

Ekspektasi vs Realitas

Dimensi Konsepsi Awal Situasi Sebenarnya
Modular/Interoperabilitas Keterampilan plug-and-play, ekosistem saling terhubung Banyak standar, implementasi rumit, interoperabilitas rendah
Nilai Pengguna Meningkatkan tingkat keberhasilan dan skalabilitas agen Tumpang tindih dengan sistem perintah yang ada, pengguna tidak termotivasi untuk beralih
Jalur Adopsi Standar bawaan dalam kerangka kerja, mendorong penyebaran Sebagian besar pengguna belum menginstal keterampilan apapun

Singkatnya:

  • Tingkat adopsi yang rendah adalah fakta, bukan kebisingan, tidak bisa menutupi masalah yang tidak ada dengan lebih banyak standar;
  • Tanpa data penggunaan yang nyata, investasi besar dalam pembangunan infrastruktur sangat tidak efisien;
  • Ada kesenjangan informasi serius antara pencipta dan pengguna produk, perlu menggunakan data penggunaan nyata dan data retensi untuk mengkalibrasi arah.

Impact Assessment

  • Pentingnya: Sedang
  • Kategori: Tren industri, alat pengembang, pengamatan teknologi

Putusan: Jika Anda mengikuti garis “standar keterampilan”, sekarang bukan saat yang terlalu awal untuk masuk—konsep ini sedang berada dalam tahap canggung di mana verifikasi sulit. Yang benar-benar dapat mengambil manfaat, adalah tim yang bersedia menginjak rem, menggunakan data penggunaan nyata untuk membimbing keputusan, bukan mereka yang terus menambah standar.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan