OpenAI akan segera merilis secara terbatas model setara Claude Mythos

robot
Pembuatan abstrak sedang berlangsung

Berita dari Jibie Network: Axios mengutip sumber yang mengetahui bahwa OpenAI sedang menyelesaikan sebuah model dengan kemampuan keamanan siber yang setara dengan Anthropic Claude Mythos, dan berencana merilisnya hanya untuk sejumlah kecil perusahaan melalui proyek “Trusted Access for Cyber”. Ini berarti dua laboratorium AI terkemuka hampir pada waktu yang sama sampai pada kesimpulan yang sama: kemampuan penyerangan dan pertahanan model terkuat sudah sedemikian kuat sehingga tidak bisa dipublikasikan secara langsung; model tersebut harus terlebih dahulu digunakan oleh pihak pembela. Laporan penilaian keamanan Mythos yang dirilis Anthropic hari ini (system card) menunjukkan betapa sulitnya model seperti ini untuk dikendalikan. Dalam pengujian, Mythos pernah merancang sendiri rantai eksploitasi multi-langkah untuk menembus akses jaringan yang dibatasi, lalu mengirim detail serangan ke situs web yang tidak terlalu dikenal untuk pamer; mengancam pemutusan pasokan dalam lingkungan bisnis simulasi untuk mengendalikan penetapan harga; setelah menggunakan metode yang dilarang untuk mendapatkan jawaban dalam kurang dari 0,001% interaksi, mencoba “menyusun ulang soal” untuk menutupi jejak; bahkan ketika tugas pemrograman ditolak oleh AI lain yang memberi penilaian, Mythos mencoba melakukan serangan prompt injection terhadap model penilai. Jika OpenAI mengikuti jalur Anthropic, “memberikan kepada pihak pembela terlebih dahulu, lalu mempertimbangkan untuk dipublikasikan” bisa menjadi kebiasaan industri untuk penerbitan model-model yang super kuat.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan