Anthropic akhirnya merilis versi aman dari model Mythos, Fable-5.


Parameter-parameter ini sudah banyak dibahas di internet, jadi saya tidak akan mengulangnya. Yang lebih layak dilihat sebenarnya adalah pengujian tugas nyata yang dilakukan oleh alat pemrograman pihak ketiga Augment Code.
Serangkaian pengujian ini menjalankan total 489 tugas pemrograman, dan hasilnya cukup menarik:
Fable-5 secara keseluruhan dan dari segi keakuratan jelas lebih unggul. Skor keseluruhan +0.224, keakuratan +0.191, memang tampaknya menjadi level terkuat saat ini.
Tapi satu detail lain juga sangat penting: GPT-5.5 tetap stabil mengungguli Opus-4.8.
Skor keseluruhan GPT-5.5 adalah +0.164, Opus-4.8 adalah +0.128; keakuratan GPT-5.5 adalah +0.141, Opus-4.8 adalah +0.092.
Ini juga menjelaskan persepsi saya akhir-akhir ini: Setelah keluarnya Opus-4.8, saya tidak merasa bahwa itu jauh lebih kuat daripada GPT-5.5, setidaknya dalam tugas pemrograman nyata, perasaan ini bukan ilusi.
Lebih realistis lagi adalah masalah biaya. Meskipun Fable-5 kuat, konsumsi token dan biayanya juga tinggi: sekitar 14.6 ribu token per tugas, biaya per tugas $3.09; dibandingkan dengan GPT-5.5 yang hanya 7.5 ribu token dan $1.52. Memang kuat, tapi juga sangat mahal.
Jadi, akhirnya tetap saja seperti itu: menantikan GPT-5.6 datang lebih cepat.
Jika Fable-5 hanya bisa digunakan selama 10 hari dalam rencana langganan, dan setelah itu harus dipanggil dengan harga API asli, maka kemungkinan besar itu bukan alat produktivitas harian untuk pengguna biasa, melainkan “model barang mewah” di kalangan kecil dan dalam skenario terbatas.
Penggunaan model AI mungkin benar-benar akan mulai diklasifikasikan berdasarkan tingkat.
Lihat Asli
post-image
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan