Anthropic menciptakan model AI terkuat dalam sejarah, tetapi tidak berani merilisnya……

robot
Pembuatan abstrak sedang berlangsung

原创 | Odaily Koran Harian Planet Odaily(@OdailyChina

作者|Azuma(@azuma_eth

8 April, perusahaan pengembang AI di balik Claude, Anthropic, secara resmi mengumumkan bahwa pihaknya akan meluncurkan rencana baru bernama “Sayap Kaca” (Project Glasswing). Rencana ini akan didorong bersama-sama dengan banyak perusahaan raksasa terkemuka seperti Amazon, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan, Linux Foundation, Microsoft, NVIDIA, dan Palo Alto Networks.

Anthropic menyatakan, ini adalah langkah darurat yang bertujuan melindungi perangkat lunak paling penting di seluruh dunia; semua pihak akan bersama-sama menggunakan versi Mythos Preview untuk menemukan dan memperbaiki potensi cacat dalam sistem yang menjadi dasar kelangsungan hidup dunia saat ini.

Yang disebut Mythos, adalah model AI generasi berikutnya yang sedang dikembangkan oleh Anthropic. Ini merupakan model pertama dalam sejarah manusia yang melewati level skala parameter lebih dari satu triliun (sebagai perbandingan, jumlah parameter model-model utama yang beredar saat ini semuanya berada pada kisaran ratusan miliar hingga satu triliun). Biaya pelatihannya mencapai angka yang mengejutkan sebesar 10 miliar dolar AS. Dibandingkan dengan model terkuat milik Claude saat ini, Opus 4.6, Mythos menunjukkan peningkatan signifikan pada pengujian seperti pengkodean perangkat lunak, penalaran akademik, dan keamanan siber.

Kabar tentang Mythos sudah beredar di pasar sejak pekan lalu. Saat itu kekhawatiran umum adalah—apakah Mythos yang memiliki kemampuan khusus keamanan siber akan memengaruhi peta pertahanan dan serangan keamanan yang berlaku saat ini? Jika disalahgunakan secara jahat, apakah akan menyebabkan insiden keamanan berskala lebih besar? Odaily pada saat itu juga pernah melaporkan hal ini, dan sempat membahas potensi dampaknya terhadap pertahanan dan serangan keamanan di industri mata uang kripto bersama para pakar keamanan di industri serta pendiri SlowMist, Yu Xuan (lihat detailnya di《Wawancara Odaily dengan Yu Xuan: Kebocoran model AI kelas “bom nuklir” milik Anthropic—bagaimana memengaruhi pertahanan dan serangan keamanan kripto?》). Namun pada saat itu, pihak Anthropic belum mengakui keberadaan Mythos secara terbuka, sehingga informasi terkait masih terbatas.

8 April, seiring dengan pengumuman rencana “Sayap Kaca”, Anthropic juga mengungkap lebih banyak detail terkait Mythos. Berdasarkan contoh uji nyata yang dipublikasikan oleh pihak Anthropic, kemampuan Mythos tidak dibesar-besarkan—bahkan perusahaan ini tidak berani merilis langsung model tersebut, demi mencegah kelompok peretas memanfaatkannya secara jahat. Sebagai gantinya, perusahaan berencana membiarkan perusahaan-perusahaan kelas atas mencoba dan melakukan penelusuran lewat rencana “Sayap Kaca” agar perbaikan atas potensi celah bisa dilakukan lebih awal.

Mythos unjuk kekuatan: dalam beberapa minggu, berhasil menemukan ribuan “celah zero-day”

Saat membahas kekuatan Mythos, Anthropic terus terang menyatakan bahwa lahirnya model ini berarti sebuah kenyataan keras sudah tiba—kemampuan pengkodean model AI telah mencapai level yang sangat tinggi, sehingga dalam menemukan dan mengeksploitasi celah perangkat lunak, mereka hampir dapat melampaui semua orang selain manusia yang paling terampil.

Berdasarkan pengungkapan dari pihak Anthropic, dalam waktu hanya beberapa minggu, Anthropic menggunakan Mythos untuk mengidentifikasi ribuan celah zero-day (yakni cacat yang bahkan belum pernah ditemukan oleh pengembang perangkat lunak sendiri sebelumnya). Banyak di antaranya termasuk celah berisiko tinggi; masalahnya mencakup semua sistem operasi utama dan semua peramban utama, serta berdampak pada sejumlah perangkat lunak penting lainnya.

Anthropic memberikan beberapa contoh kasus yang cukup representatif:

  • Mythos menemukan celah yang sudah ada di OpenBSD selama 27 tahun—sistem tersebut selama ini terkenal “sangat aman”, dan banyak digunakan untuk infrastruktur penting seperti firewall. Celah ini memungkinkan penyerang membuat sistem mengalami crash secara langsung dari jarak jauh;
  • Pada pustaka pemrosesan video FFmpeg yang digunakan oleh banyak perangkat lunak, Mythos menemukan sebuah celah yang sudah ada selama 16 tahun. Bagian kode yang menjadi sumber masalah itu pernah dipicu oleh pengujian terotomatisasi lebih dari 5 juta kali, tetapi tetap tidak pernah ditemukan;
  • Mythos juga mampu merangkai otomatis beberapa celah di kernel Linux, meningkatkan hak istimewa dari pengguna biasa hingga kendali penuh atas server.

Yang lebih mengkhawatirkan adalah, Anthropic menyatakan bahwa sebagian besar celah tersebut ditemukan dan dibangun jalur eksploitnya secara “mandiri” oleh Mythos hampir tanpa campur tangan manusia. Ini mungkin berarti AI sudah mulai memiliki kemampuan pertahanan-serangan otomatis yang mirip dengan tim peretas kelas atas.

Pada tolok ukur evaluasi, Mythos juga menunjukkan evolusi yang jauh tertinggal dari Opus 4.6. Misalnya, pada pengujian replikasi celah keamanan siber, Mythos mencapai 83,1%, sedangkan Opus 4.6 adalah 66,6%; pada berbagai pengujian pengkodean dan penalaran, skor Mythos juga memimpin dengan lompatan besar.

Mungkin karena kemampuan Mythos terlalu kuat, Anthropic tidak memilih untuk membuka model secara langsung, melainkan terlebih dahulu meluncurkan rencana “Sayap Kaca”, agar seluruh internet lebih dahulu “diperkuat”.

Melalui rencana tersebut, Anthropic akan memberikan akses lebih awal ke versi Mythos Preview kepada pihak yang ikut berpartisipasi untuk menemukan dan memperbaiki celah atau kelemahan dalam sistem dasarnya—dengan fokus utama pada tugas-tugas seperti deteksi celah lokal, pengujian kotak hitam untuk program biner, penguatan keamanan terminal, dan pengujian penetrasi sistem.

Anthropic juga berjanji akan memberikan** total kuota penggunaan model senilai 100 juta dolar AS kepada pihak yang berpartisipasi**, untuk mendukung penggunaan selama seluruh tahap riset pratinjau. Setelah itu, versi Mythos Preview akan dibuka kepada peserta dengan harga masing-masing 25 dolar AS / 125 dolar AS per satu juta input / output tokens (peserta juga dapat mengakses model tersebut melalui Claude API, Amazon Bedrock, Google Cloud Vertex AI, serta Microsoft Foundry). Selain kuota penggunaan model, Anthropic juga akan menyumbangkan 2,5 juta dolar AS kepada Alpha-Omega dan OpenSSF melalui Linux Foundation, serta menyumbangkan 1,5 juta dolar AS kepada Apache Software Foundation, guna membantu para pemelihara perangkat lunak sumber terbuka menghadapi lingkungan keamanan yang terus berubah.

Anthropic berencana secara bertahap memperluas cakupan partisipasi “Sayap Kaca”, dan terus mendorongnya selama berbulan-bulan, sekaligus sebisa mungkin membagikan pengalaman agar organisasi lain dapat menerapkan pengalaman terkait pada pembangunan keamanan mereka sendiri. Dalam 90 hari, Anthropic akan mempublikasikan laporan berisi hasil antara, termasuk celah yang sudah diperbaiki serta langkah perbaikan keamanan yang dapat diungkapkan.

Teknologi hanya akan terus ditingkatkan, tetapi tidak perlu terlalu khawatir

AI sedang mengubah dunia yang kita kenal secara tidak dapat dibatalkan, termasuk bidang keamanan siber yang menjadi fokus dalam artikel ini. Ketika ambang batas untuk menemukan dan mengeksploitasi celah diturunkan secara drastis, orang tidak bisa tidak khawatir: apakah AI akan menjadi ujung tombak di tangan pelaku berbahaya, mengancam keseimbangan keamanan siber yang ada? (PS: bagi pengguna mata uang kripto yang perlu menaruh uang sungguhan di sistem dompet atau protokol di blockchain, kekhawatiran ini akan terasa semakin kuat.)

Untuk menjawab masalah tersebut, Anthropic berpandangan “masih ada alasan untuk tetap optimistis”. Model AI berbahaya karena memiliki kemampuan untuk menimbulkan dampak berbahaya di tangan orang-orang yang tidak bertanggung jawab. Namun pada saat yang sama, AI juga memiliki nilai yang tak ternilai dalam menemukan dan memperbaiki cacat penting pada perangkat lunak serta mengembangkan perangkat lunak baru yang lebih aman.

Dapat diprediksi bahwa kemampuan AI akan terus berkembang pesat dalam beberapa tahun ke depan. Tetapi ketika muncul cara serangan baru, mekanisme pertahanan baru juga akan bermunculan secara bersamaan. Peningkatan teknologi tidak dapat dihindari, namun ini tidak berarti risiko pasti akan lepas kendali—selama sistem pertahanan berevolusi selaras, bahkan dapat memanfaatkan AI untuk membangun benteng keamanan yang lebih kuat.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan