Tim Berkeley mengumumkan keberhasilan menembus 8 tolok ukur utama penilaian agen cerdas dan merilis alat sumber terbuka

ME News Berita, 19 April (UTC+8), kelompok penelitian kecerdasan buatan Berkeley (berkeley_ai) mengutip pernyataan Dawn Song, mengumumkan bahwa timnya berhasil menembus 8 tolok ukur utama pengujian agen cerdas. Tim memutuskan untuk merilis alat yang digunakan untuk mencapai hasil ini secara terbuka, dan menamainya BenchJack. Alat ini digambarkan sebagai "pengujian penetrasi terhadap pengujian", bertujuan membantu pengembang lain secara aktif menguji dan menemukan potensi kelemahan dalam sistem pengujian mereka sendiri. (Sumber: InFoQ)
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • 9
  • 1
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
DrinkWaterBeforeTheMarket
· 15menit yang lalu
Alat sumber terbuka + metodologi yang terbuka, inilah seharusnya menjadi ciri khas dunia akademik
Lihat AsliBalas0
ElevatorMeme
· 2jam yang lalu
Penasaran bagaimana tepatnya mereka menembusnya, tunggu makalahnya
Lihat AsliBalas0
FrontrunFail
· 3jam yang lalu
8 standar utama semuanya hancur, dunia evaluasi akan berguncang
Lihat AsliBalas0
AutumnSlopeCabin
· 3jam yang lalu
Untuk pengujian penetrasi yang berkaitan dengan evaluasi, konsep ini cukup baru.
Lihat AsliBalas0
OutsiderOfZhiyuandao
· 4jam yang lalu
Tim Dawn Song turun tangan, saya menganggap ini bernilai tinggi
Lihat AsliBalas0
ChaintraceAuntie
· 4jam yang lalu
Cermin Pembesar Penilaian Agen Cerdas Telah Tiba
Lihat AsliBalas0
SnackFi
· 4jam yang lalu
Mencari kelemahan secara aktif lebih baik daripada diserang secara pasif, dukung semangat terbuka sumber ini
Lihat AsliBalas0
ColdWalletFitnessCoach
· 4jam yang lalu
Nanti saat melihat papan peringkat, harus tanya dulu: Apakah sudah melindungi dari BenchJack?
Lihat AsliBalas0
HedgeHedgeBaby
· 4jam yang lalu
BenchJack Nama ini agak keren, gabungan dari benchmark + hijack kan
Lihat AsliBalas0
Lihat Lebih Banyak
  • Disematkan