Hari ini Anthropic merilis model paling berbahaya mereka


Semacam. Model ini disebut Mythos, dan sangat mahir dalam menemukan dan membobol perangkat lunak sehingga Anthropic menghabiskan 2 bulan hanya membiarkan pembela siber dan perusahaan infrastruktur mendekatinya.
Apa yang Anda dapatkan hari ini adalah Fable 5, model yang sama dengan filter yang memblokir pertanyaan tentang keamanan siber, biologi, dan kimia dan menyerahkannya ke model yang lebih lemah sebagai gantinya.
Namun filter itu hanya aktif pada kurang dari 5% sesi. Jadi 95% dari waktu Anda berbicara dengan hal yang mereka katakan terlalu berbahaya untuk diberikan.
Tim merah Anthropic menghabiskan 1.000 jam mencoba merusak perlindungan dan tidak bisa.
Tapi internet memiliki lebih dari 1.000 jam dan alasan yang jauh lebih baik untuk mencoba. Setiap model terkunci dalam sejarah telah dibobol, biasanya dalam beberapa hari.
Minggu-minggu mendatang akan menjadi penentu.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan