Cua sumber terbuka driver computer-use latar belakang macOS: merekayasa balik kerangka kerja pribadi Apple, agen mengontrol aplikasi tanpa mengambil alih kursor.

robot
Pembuatan abstrak sedang berlangsung
AIMPACT berita, 24 April (UTC+8), menurut pemantauan Dongcha Beating, proyek infrastruktur computer-use open source Cua merilis cua-driver, sebuah driver asli macOS yang memungkinkan agen mana pun mengoperasikan aplikasi Mac di latar belakang. Saat agen mengklik, mengetik, atau mengambil tangkapan layar, kursor pengguna tidak bergerak, fokus tidak berubah, dan macOS tidak akan beralih desktop antar Spaces. Teknologi inti berasal dari rekayasa balik kerangka kerja privat Apple, SkyLight. Peristiwa sintetis konvensional melalui CGEventPost yang melewati aliran peristiwa HID akan memindahkan kursor; \CGEvent.postToPid\ dapat mengirim secara terarah tetapi proses rendering Chromium akan menyaringnya. cua-driver menggunakan SLEventPostToPid dari SkyLight melalui saluran tepercaya WindowServer untuk mengirim peristiwa, melewati HID, sehingga Chromium juga dapat menerimanya. Aktivasi jendela meminjam praktik manajer jendela yabai: menggunakan SLPSPostEventRecordTo hanya untuk membalikkan status aktivasi AppKit dari aplikasi target tanpa menaikkan level jendela, menghindari pemicu pengikut Spaces. Untuk aplikasi Electron (Slack, VS Code, Discord, dll.), menggunakan _AXObserverAddNotificationAndCheckRemote yang tidak dipublikasikan untuk memastikan pohon aksesibilitas tetap diperbarui saat jendela terhalang. cua-driver menyediakan tiga mode tangkapan: mode ax hanya mengembalikan pohon aksesibilitas, tidak memerlukan izin perekaman layar; mode vision hanya mengembalikan tangkapan layar; mode som (default) mengembalikan keduanya, agen dapat mengklik melalui indeks elemen atau koordinat piksel. Driver mendukung protokol MCP, dapat terhubung ke klien seperti Claude Code, Cursor, atau dipanggil melalui baris perintah. Dua batasan yang diketahui: klik kanan pada konten web Chromium tidak berfungsi, aplikasi kelas Canvas (Blender, Unity, mesin game) masih memerlukan aktivasi latar depan singkat. Setelah OpenAI mengakuisisi tim Apple Shortcuts Sky, Codex pertama kali meluncurkan fitur computer-use latar belakang tetapi tidak open source. Francesco Bonacci dari Cua menyatakan bahwa driver computer-use latar belakang harus menjadi infrastruktur universal, bukan fungsi eksklusif untuk satu produk. (Sumber: BlockBeats)
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan