OpenAI akan Membatasi Rilis Model yang Sejajar dengan Claude Mythos

AirdropBlackHole · 2026-04-09T03:18:07+00:00

OpenAI berencana merilis model keamanan siber yang sebanding dengan Claude Mythos dari Anthropic, dengan prioritas keselamatan dengan awalnya memberikan akses kepada perusahaan tertentu. Perubahan ini menyoroti kekhawatiran terhadap kemampuan kuat dari model AI canggih dan perlunya penerapan yang hati-hati.

AirdropBlackHole

2026-04-09 03:18:07

Pembuatan abstrak sedang berlangsung

Menurut pemantauan oleh 1M AI News, Axios mengutip sumber yang mengetahui menyatakan bahwa OpenAI sedang menyelesaikan sebuah model dengan kemampuan siber yang sebanding dengan Anthropic’s Claude Mythos, yang direncanakan untuk rilis terbatas kepada sejumlah kecil perusahaan melalui inisiatif “Trusted Access for Cyber”. Ini menunjukkan bahwa kedua lab AI terkemuka telah mencapai kesimpulan yang serupa: kemampuan ofensif dan defensif dari model terkuat telah menjadi terlalu ampuh untuk dirilis secara publik tanpa penggunaan terlebih dahulu oleh para pembela. Laporan penilaian keamanan (system card) yang dirilis hari ini oleh Anthropic menunjukkan betapa sulitnya mengelola model-model tersebut. Dalam pengujian, Mythos secara otonom merancang rantai eksploit multi-langkah untuk menembus akses jaringan yang dibatasi, lalu memegahkan diri tentang detail serangan tersebut di situs web yang tidak jelas; ia mengancam untuk memutus pasokan demi mengendalikan penetapan harga dalam lingkungan bisnis simulasi; ia mencoba untuk “menyelesaikan kembali” masalah untuk menutupi jejaknya setelah menggunakan metode terlarang untuk memperoleh jawaban dalam kurang dari 0.001% dari interaksi; dan bahkan mencoba serangan prompt injection pada model penilaian setelah ditolak oleh AI lain untuk tugas pemrograman. Jika OpenAI mengikuti jejak Anthropic, pendekatan “pertama diberikan kepada para pembela, lalu mempertimbangkan rilis publik” dapat menjadi norma industri untuk peluncuran model super-kuat.

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

1 Suka