Anthropic meluncurkan Fable 5 dengan penguncian keamanan untuk membuka kemampuan tingkat Mythos

Penulis: Li Dan, Wall Street Journal

Dalam rangka mengejar IPO, Anthropic meluncurkan produk besar.

Pada hari Selasa waktu Timur AS, Anthropic secara resmi merilis Claude Fable 5, dan secara bersamaan meluncurkan Claude Mythos 5. Keduanya didasarkan pada arsitektur model dasar yang sama, di mana Fable 5 adalah model Mythos pertama yang terbuka untuk publik, sementara Mythos 5 mempertahankan kemampuan yang lebih lengkap, saat ini hanya terbuka untuk beberapa lembaga terpercaya.

Anthropic menyatakan bahwa Fable 5 telah menjadi model dengan kemampuan terkuat yang pernah dirilis secara publik oleh perusahaan ini, mencapai tingkat terdepan di industri dalam bidang rekayasa perangkat lunak, penelitian ilmiah, analisis keuangan, pemahaman visual, dan lain-lain. Ini berarti, teknologi Mythos yang sebelumnya dibatasi aksesnya karena kemampuan pertahanan jaringan yang kuat, akhirnya mulai memasuki pasar umum.

Namun, Anthropic tetap memberlakukan pembatasan ketat pada Fable 5: masalah yang melibatkan keamanan jaringan, biologi, dan kimia yang sensitif akan secara otomatis dialihkan ke Claude Opus 4.8 yang memiliki kemampuan lebih lemah, untuk mengurangi risiko penyalahgunaan.

Harga Fable 5 dan Mythos 5 adalah 10 dolar AS per juta token input dan 50 dolar AS per juta token output. Anthropic menunjukkan bahwa harga ini kurang dari setengah dari versi pratinjau Claude Mythos, dan menyatakan bahwa peluncuran model baru ini menandai langkah maju perusahaan menuju target yang telah ditetapkan, yaitu membawa kemampuan AI canggih kepada sebanyak mungkin pengguna dengan cara yang secepat dan seaman mungkin.

Bagi Anthropic yang sedang mempersiapkan IPO, ini bukan hanya peningkatan model, tetapi juga sebuah “pamer kekuatan” ke pasar modal, menunjukkan bahwa mereka mampu membangun AI terdepan sekaligus mengendalikan risiko secara efektif.

Seberapa kuat sebenarnya Fable 5, model “tercanggih” dari Anthropic?

Menurut definisi Anthropic, Fable 5 adalah model Mythos pertama yang “dapat dipasang secara aman dan terbuka untuk publik.”

Anthropic menyatakan bahwa Fable 5 mencapai tingkat terdepan di industri dalam hampir semua standar pengujian, terutama unggul dalam tugas jangka panjang, multi-langkah, dan kompleks. Mereka menegaskan: “Semakin panjang dan kompleks tugasnya, semakin jelas keunggulan Fable 5 dibanding model lain.”

Pengembangan perangkat lunak adalah salah satu kemampuan utamanya yang paling menonjol.

Stripe, perusahaan pembayaran besar, dalam pengujian awal menemukan bahwa Fable 5 mampu menyelesaikan migrasi kode dalam sebuah basis kode besar berisi 50 juta baris Ruby hanya dalam satu hari, padahal pekerjaan tersebut biasanya membutuhkan dua bulan oleh sebuah tim.

Dalam bidang keuangan dan pekerjaan berbasis pengetahuan, Anthropic mengutip penilaian pihak ketiga yang menyatakan bahwa Fable 5 meraih skor tertinggi di industri dalam tugas-tugas seperti penalaran keuangan tingkat tinggi, analisis dokumen, pemahaman tabel dan grafik. Perusahaan perdagangan IMC juga menyatakan bahwa model ini tampil menonjol dalam pengujian pencarian fakta, analisis akar penyebab, penalaran konseptual, dan analisis hasil yang diharapkan.

Kemampuan visualnya juga meningkat secara signifikan.

Anthropic menyatakan bahwa Fable 5 mampu mengekstrak data akurat dari grafik penelitian yang kompleks, bahkan mampu merekonstruksi kode sumber aplikasi web hanya dari screenshot. Dalam sebuah pengujian internal, model ini menyelesaikan permainan Pokémon FireRed hanya dengan input visual, sementara versi Claude sebelumnya membutuhkan alat bantu tambahan untuk melakukan hal tersebut.

Selain itu, Fable 5 juga semakin baik dalam konteks panjang dan memori berkelanjutan. Anthropic menyebutkan bahwa model ini mampu tetap fokus dalam tugas jangka panjang yang melibatkan jutaan token, dan memanfaatkan catatan sendiri untuk terus mengoptimalkan output.

Mythos 5 lebih kuat, tetapi publik masih belum bisa menggunakannya secara langsung

Bersamaan dengan peluncuran Fable 5, ada juga Mythos 5 yang sangat dinantikan.

Anthropic mengungkapkan bahwa kedua produk ini sebenarnya menggunakan model dasar yang sama, tetapi Mythos 5 menghilangkan beberapa batasan keamanan, sehingga mempertahankan kemampuan yang lebih lengkap dalam bidang keamanan jaringan dan penelitian ilmiah.

Anthropic berencana, Mythos 5 hanya akan dibuka melalui inisiatif khusus bernama Project Glasswing, kepada sejumlah kecil lembaga yang telah menjalani proses peninjauan ketat, termasuk lembaga pemerintah AS, operator infrastruktur penting, dan organisasi pertahanan keamanan siber.

Anthropic menyatakan bahwa model ini memiliki “kemampuan keamanan siber terkuat di dunia,” dan akan secara bertahap diperluas melalui “Program Akses Tepercaya” (Trusted Access Program).

Dalam bidang ilmu kehidupan, Anthropic juga mengungkapkan beberapa hasil eksperimen yang menarik.

Anthropic menyatakan bahwa Mythos 5 sudah mampu melakukan proses desain protein secara mandiri, dan dalam beberapa tugas pengembangan obat, bahkan mencapai atau melampaui tingkat peneliti profesional. Tim riset mereka juga menyebutkan bahwa sebuah hipotesis mekanisme baru tentang protein Escherichia coli yang diajukan oleh model ini kemudian diverifikasi oleh laboratorium independen.

Perjalanan dari tidak bisa dipublikasikan karena terlalu berbahaya hingga resmi digunakan secara komersial, apa yang dialami Mythos?

Peluncuran ini paling menarik karena Anthropic akhirnya menyelesaikan masalah inti yang sebelumnya menghambat penyebaran Mythos secara terbuka.

Awal tahun ini, saat Anthropic pertama kali menampilkan Mythos Preview, hal ini sempat mengguncang industri. Perusahaan secara langka memperingatkan bahwa model ini mampu menemukan dan memanfaatkan celah perangkat lunak di berbagai sistem operasi dan browser utama, menunjukkan kemampuan yang belum pernah ada dalam bidang pertahanan jaringan, sehingga memutuskan untuk tidak membuka akses ke publik.

Keputusan ini sangat jarang di industri AI.

Biasanya, perusahaan AI cenderung memperluas jangkauan model secepat mungkin, tetapi Anthropic memilih untuk membatasi akses secara aktif, hanya mengizinkan beberapa mitra untuk melakukan pengujian. Sebelumnya, Project Glasswing mencakup sekitar 50 lembaga, dan baru-baru ini menambah 150 organisasi lagi, sehingga total mendekati 200.

Untuk mendorong peluncuran terbuka, Anthropic menambahkan beberapa lapis mekanisme keamanan pada Fable 5.

Ketika sistem mengenali permintaan yang sensitif terkait keamanan jaringan, biologi, kimia, dan distilasi model, pengguna sebenarnya hanya mendapatkan jawaban dari Claude Opus 4.8, bukan dari Fable 5 itu sendiri. Perusahaan menyatakan bahwa tingkat pembatasan ini kurang dari 5%.

Anthropic juga melakukan lebih dari 1000 jam pengujian “jailbreak” internal, berusaha mencari cara untuk melewati batasan keamanan. Mereka menyatakan bahwa para penguji tidak mampu menemukan solusi umum yang mampu secara luas mengakali mekanisme perlindungan.

Pertarungan penting menjelang IPO: Anthropic berusaha membuktikan bahwa kemampuan dan keamanan dapat berjalan beriringan

Dari sudut pandang bisnis, peluncuran Fable 5 dan Mythos 5 terjadi pada tahap paling krusial bagi Anthropic.

Pada akhir Mei, Anthropic menyelesaikan pendanaan sebesar 6,5 miliar dolar AS, dengan valuasi pasca-investasi mencapai 96,5 miliar dolar AS, menjadikannya salah satu startup AI dengan valuasi tertinggi di dunia, melampaui OpenAI. Tidak lama kemudian, pada awal Juni, mereka secara diam-diam mengajukan dokumen IPO, menyiapkan langkah cepat menuju listing musim gugur ini.

Satu pertanyaan yang selalu menjadi perhatian pasar: apakah Anthropic mampu mengubah kemampuan riset terdepan mereka menjadi produk komersial yang dapat diskalakan.

Meskipun Mythos sebelumnya dianggap sebagai salah satu AI keamanan siber paling canggih di dunia, karena risiko keamanan, model ini tidak bisa digunakan secara massal, sehingga nilai komersialnya terbatas. Kini, dengan peluncuran Fable 5, Anthropic tampaknya telah menemukan solusi kompromi—mempertahankan sebagian besar kemampuan canggih sambil memenuhi persyaratan keamanan melalui routing dinamis dan kontrol izin.

Bagi investor potensial, model ini memiliki arti penting.

Di satu sisi, Anthropic membuktikan bahwa kemampuan teknologi mereka tetap di garis depan industri; di sisi lain, mereka juga menunjukkan keunggulan dalam pengelolaan model dan pengendalian risiko yang berbeda dari kompetitor, yang semakin menjadi perhatian regulator dan pasar modal.

Selain itu, perusahaan juga menaikkan harga model tingkat tinggi. Harga Fable 5 dan Mythos 5 adalah 10 dolar per juta token input dan 50 dolar per juta token output, sekitar dua kali lipat Opus 4.8, tetapi Anthropic yakin efisiensi yang lebih tinggi dapat mengimbangi sebagian biaya tersebut.

Seiring mendekatnya IPO, Anthropic sedang menyampaikan sebuah cerita baru ke pasar modal: mereka tidak hanya memiliki salah satu model AI paling kuat, tetapi juga mampu menyeimbangkan antara keamanan, regulasi, dan komersialisasi. Dan Fable 5 adalah produk inti terbaru dari narasi ini.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan