Perantara Pengelolaan Anthropic: Kendala AI Perusahaan Beralih dari Kemampuan Model ke Infrastruktur

robot
Pembuatan abstrak sedang berlangsung

Titik lemah telah berpindah dari model ke infrastruktur

Akun resmi Claude di X (akun X resmi) memberi contoh tentang Asana yang menghubungkan agen yang dikelola; gagasan intinya adalah: bagi perusahaan yang memakai AI berbasis agen, hambatannya kini bukan lagi “apakah modelnya cukup cerdas”, melainkan “apakah ada fondasi operasional yang bisa diskalakan”. Topik bergeser dari “perang perlombaan persenjataan kemampuan” (misalnya Swarm dari OpenAI) menuju “bisakah benar-benar dideploy”. Beta dari Anthropic memecah kompleksitas logika agen dengan runtime sandbox dan persistensi status. Sejumlah ahli menyebarkan kerangka ini di sesi QRT, mengutip peningkatan kinerja sekitar 10% untuk tugas terstruktur, yang mendukung klaim bahwa dari prototipe ke produksi dapat dipangkas dari hitungan bulan menjadi beberapa hari.

Ada baiknya menekankan satu hal: narasi seperti ini sebenarnya melemahkan kekhawatiran tentang “kegagalan otonomi agen”—misalnya penelitian CMU dengan tingkat kegagalan 70% lebih mirip sebagai akibat infrastruktur yang belum menyusul, bukan masalah pada otonominya sendiri. Agen yang dikelola menargetkan kekurangan di tingkat rekayasa seperti ini, bukan untuk menyelesaikan masalah keamanan AI yang lebih luas.

Sinyal eksternal menguatkan arah ini: blog teknik Anthropic menjelaskan cara memisahkan “otak” (Claude) dan “tangan” (sandbox), mendukung sesi yang toleran kesalahan dan bisa berjalan selama beberapa jam, serta mengintegrasikan Asana Work Graph untuk tugas kolaborasi multi-pihak. Di pasar sekunder, ASAN tidak mengalami kenaikan yang berarti dalam 48 jam terakhir, menunjukkan bahwa investor belum menganggap ini sebagai faktor yang akan membuatnya jauh tertinggal dari Microsoft Copilot. Di tingkat kebijakan, ada gema dalam diskusi tentang keamanan AI (misalnya informasi kepala akses terkontrol dalam beta Anthropic), sehingga bentuk yang dikelola lebih mudah masuk ke skenario yang diatur—namun selain dari X (Twitter), pihak Asana kurang memiliki konfirmasi yang lebih tegas, sehingga terdapat risiko verifikasi.

  • Kecepatan adopsi dan transparansi biaya terhubung: penagihan berdasarkan token di atas $0.08 per “jam sesi aktif”, sehingga lebih murah daripada self-hosting. Namun bagi perusahaan, apakah agen diperlakukan sebagai “rekan” atau sebagai black box akan menentukan kecepatan penetrasi yang sebenarnya. Pengguna awal seperti Rakuten disebut-sebut sudah menerapkan dalam waktu seminggu, dengan peningkatan efisiensi integrasi sekitar 80%.
  • Anthropic membangun parit “managed-infrastructure”: dengan mengikat penggunaan Claude pada fondasi runtime yang dikelola, hal ini kurang menguntungkan untuk solusi open source yang tidak memiliki lapisan managed setara (misalnya Llama dari Meta); konsekuensinya adalah path dependency makin menguat.
  • Pembeli perusahaan masih berhati-hati: Asana AI Teammates menonjolkan alur kerja yang peka konteks (misalnya pengalihan tiket kerja dengan checkpoint), tetapi integrasi yang belum tervalidasi dengan baik dapat memunculkan masalah “shadow AI”. Pembuat produk berpotensi diuntungkan dalam jangka pendek, sedangkan investor bisa meremehkan hambatan kepatuhan yang ada.

Penilaian saya:

  • Nilai sebenarnya dari agen yang dikelola ada pada “operasi dan tata kelola yang bisa diskalakan”, bukan pada terobosan performa di satu titik saja.
  • Harga, tata kelola, dan kemampuan diaudit akan menjadi medan pertempuran utama dalam 12-24 bulan ke depan.
  • Tuntutan interoperabilitas justru akan mengikis keunggulan penguncian; platform perlu melakukan ekspansi multi-vendor di luar Claude.

Kembali menilai paradigma kolaborasi multi-pihak

Pijakan Asana mengubah AI produktivitas dari “asisten untuk individu” menjadi “kolaborator yang tertanam”, menautkan infrastruktur Anthropic yang dilimpahkan (offload) dengan UX kolaborasi multi-pihak. VentureBeat mengaitkannya dengan masalah memori agen yang lama mengganggu: Work Graph Asana mengandalkan konteks persisten lintas sesi, lebih unggul dibanding alat seperti Google Workspace AI yang lebih terfragmentasi.

Peliputan opini tampak tersegmentasi: komunitas berbahasa Tionghoa (terutama Cina dan Korea) menekankan “kecepatan ekspansi produktivitas 10 kali”, sedangkan para ahli berbahasa Inggris lebih sering menyebut bahwa kolaborasi multi-agen masih dalam tahap pratinjau, sehingga penerapan untuk alur kerja yang kompleks mungkin terhambat. Perbedaan ini berasal dari ekspektasi yang berbeda terhadap “transparansi harga dan kemampuan otonomi”—yang pertama lebih optimistis, yang kedua fokus pada detail koordinasi dan biaya yang belum terselesaikan.

Tabel di bawah merangkum empat jenis narasi arus utama, sinyal, dan dampak industri, serta disertai penilaian strategi:

Skuad narasi Bukti/sinyal Dampak pada cara pandang industri Penilaian strategi
Offload infrastruktur mempercepat adopsi Dokumentasi Anthropic: eksekusi sandbox, persistensi status, $0.08/jam; contoh Asana: penyerahan tugas dalam workflow Hambatan bergeser dari “kecerdasan model” ke “kecepatan deployment”, topik berpindah dari self-build ke layanan managed Terlalu dibesar-besarkan di margin: perusahaan akhirnya akan memakai tumpukan campuran, tetapi untuk pengguna lapisan tengah-menengah dalam jangka pendek Anthropic akan tetap diperlakukan sebagai opsi default; pasar masih meremehkan ruang serangan balik dari open source
UX kolaborasi multi-pihak adalah pembeda X/Twitter: Asana fokus pada kolaborasi; VentureBeat: Work Graph menyediakan konteks lintas sesi Dari “entitas otonom” menjadi “kolaborasi manusia-mesin”, alat individual makin tersisih posisinya di level perusahaan Ini wawasan kunci: platform workflow (misalnya Asana) memiliki posisi unggul dalam membentuk LLM umum; diperkirakan dalam 18 bulan penetrasi paket produktivitas meningkat 20-30%
Risiko otonomi dilebih-lebihkan Tulisan blog bantah CMU: kegagalan banyak karena infrastruktur belum menyusul; QRT ahli: peningkatan 10% untuk tugas terstruktur Melemahkan narasi “kegagalan agen”, mengalihkan perhatian pada kematangan infrastruktur Anggap sebagai noise: risiko nyata ada pada tata kelola dan kepatuhan; kebijakan akan mendorong percakapan yang bisa ditelusuri, sehingga bentuk managed diuntungkan
Efek penguncian dan interoperabilitas Harga saham tidak bereaksi; perbandingan X/Twitter: Copilot/Swarm: decoupling runtime vs suite terintegrasi Menguatkan kekhawatiran penguncian ekosistem, masa depan “open source vs closed source” terpolarisasi Parit tidak sekuat itu: perusahaan akan menuntut interoperabilitas, memaksa Asana memperluas pasokan di luar Claude
  • Dimensi waktu: manfaat riil kolaborasi multi-pihak dan tata kelola diperkirakan mulai terlihat bertahap dalam 12-24 bulan.
  • Pembagian peran: pembuat produk dan pembeli perusahaan akan lebih dulu menikmati manfaat; reaksi penetapan harga dana pasar sekunder bisa tertinggal.

Significance: Tinggi
Categories: Peluncuran produk, tren industri, adopsi perusahaan

Ringkasan: agen yang dikelola adalah narasi utama untuk penerapan agen tingkat perusahaan saat ini; masih berada pada posisi “lebih awal dari waktunya”. Yang paling diuntungkan adalah pembuat produk yang fokus pada penerapan dan kepatuhan, serta pembeli perusahaan; dana transaksi dan investor pasar sekunder saat ini memberi harga terlalu lambat. Peneliti sebaiknya terus memantau tolok ukur multi-agen dan penerapan tata kelola; dana berjangka panjang sebaiknya menunggu jendela validasi tata kelola dan interoperabilitas dalam 12-24 bulan.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan