OpenRouter luncurkan Fusion API: Pendekatan campuran tiga model mendekati Fable 5, biayanya hanya setengahnya

OpenRouter pada 13 Juni secara resmi meluncurkan Fusion API, memungkinkan pengembang untuk memanggil beberapa model secara paralel melalui satu API call, kemudian digabungkan oleh model Judge untuk menghasilkan jawaban terbaik. Dalam pengujian standar mendalam DRACO, Fusion mencapai 69% mengungguli Claude Fable 5 yang hanya 65,3%, sementara satu panel yang terdiri dari Gemini 3 Flash, Kimi K2.6, dan DeepSeek V4 Pro yang berbiaya rendah hanya selisih kurang dari 1%, tetapi biayanya hanya setengahnya.
(Latar belakang: Google memimpin platform routing AI OpenRouter, valuasi 1,3 miliar dolar, pertumbuhan 240% dalam setahun)
(Tambahan latar belakang: Analisis 100 triliun Token oleh OpenRouter: Apa sebenarnya manusia gunakan AI, kebangkitan model China, dan rahasia retensi pengguna)

Daftar Isi Artikel

Toggle

  • Pengujian standar DRACO: Fusion secara menyeluruh mengungguli raja tunggal
  • Panel anggaran juga bisa bersaing: gabungan tiga model hanya kalah dari Fable kurang dari 1%
  • Fusion bukan pengganti Fable, tapi skenario penggunaannya sangat jelas
  • Empat cara panggil dalam satu panduan

Platform routing AI populer OpenRouter secara resmi meluncurkan Fusion API pada 13 Juni, fitur baru ini memungkinkan pengembang mengirim satu pertanyaan secara bersamaan ke beberapa model, kemudian model Judge membaca semua respons, menganalisis secara struktural termasuk poin konsensus, kontradiksi, cakupan sebagian, wawasan unik, dan titik buta, lalu menulis jawaban akhir berdasarkan analisis tersebut. Seluruh pipeline berjalan di server, sehingga pengalaman pengguna sama seperti memanggil satu model saja.

Pengujian standar DRACO: Fusion secara menyeluruh mengungguli raja tunggal

Tim OpenRouter melakukan evaluasi menggunakan standar penelitian mendalam DRACO dari Perplexity AI, yang mencakup 100 soal dari 10 bidang berbeda, dengan penilaian meliputi keakuratan fakta (sekitar 20 item), kedalaman dan luasnya (sekitar 9 item), kualitas presentasi (sekitar 6 item), dan kualitas referensi (sekitar 5 item), serta mekanisme bobot negatif yang memberi penalti jika model memberikan informasi salah.

Berikut hasil penilaian dari berbagai konfigurasi:

  • Fusion (Fable 5 + GPT-5.5 → Penggabungan Opus 4.8): 69,0% 🥇
  • Fusion (Opus 4.8 + GPT-5.5 + Gemini 3.1 Pro → Penggabungan Opus 4.8): 68,3%
  • Fusion (Opus 4.8 + GPT-5.5 → Penggabungan Opus 4.8): 67,6%
  • Fusion (Penggabungan Opus 4.8 sendiri): 65,5%
  • Claude Fable 5 tunggal: 65,3% (hanya menyelesaikan 93/100 soal, karena filter konten menghalangi)
  • Fusion (Gemini 3 Flash + Kimi K2.6 + DeepSeek V4 Pro → Penggabungan Opus 4.8): 64,7% 🔥
  • DeepSeek V4 Pro tunggal: 60,3%
  • GPT-5.5 tunggal: 60,0%
  • Claude Opus 4.8 tunggal: 58,8%

Panel anggaran juga bisa bersaing: gabungan tiga model hanya kalah dari Fable kurang dari 1%

Hasil yang paling mengejutkan dari pasar berasal dari satu panel “anggaran”, yaitu Gemini 3 Flash, Kimi K2.6, dan DeepSeek V4 Pro yang relatif murah, setelah digabungkan dengan Fusion mendapatkan skor 64,7%, tidak hanya mengalahkan GPT-5.5 (60,0%) dan Opus 4.8 (58,8%), tetapi juga hanya selisih kurang dari 1% dari Claude Fable 5, sementara biayanya hanya setengah dari model terakhir. Ini berarti pengembang dapat memperoleh kemampuan penelitian mendalam yang mendekati model top dengan biaya inferensi yang lebih rendah.

Penemuan menarik lainnya adalah: “menggabungkan sendiri” juga efektif. Opus 4.8 sebagai dua anggota panel (dua salinan model yang sama) kemudian digabungkan oleh Opus 4.8 sebagai Judge, mendapatkan skor 65,5%, lebih tinggi dari Opus 4.8 tunggal (58,8%) sebesar 6,7 poin. Ini menunjukkan bahwa peningkatan performa Fusion sebagian besar berasal dari langkah sintesis itu sendiri, bahkan menjalankan model yang sama dua kali dengan jalur inferensi berbeda, alat yang berbeda, dan sumber yang berbeda, tetap bisa memberikan keuntungan signifikan.

Fusion bukan pengganti Fable, tapi skenario penggunaannya sangat jelas

CEO OpenRouter, Alex Atallah, di X menyatakan bahwa Fusion dapat mencapai “kecerdasan setara Fable, dengan harga setengahnya”. Namun tim juga mengakui bahwa standar DRACO tidak mencakup tugas jangka panjang (long-horizon), yang merupakan kekuatan utama Claude Fable 5. Untuk tugas kompleks yang membutuhkan banyak langkah dan konteks panjang, Fable masih belum tergantikan dalam waktu dekat.

Dalam skenario pengembangan perangkat lunak, Fusion bukan solusi langsung menggantikan model pemrograman. OpenRouter merancang Fusion sebagai alat server, yang secara otomatis memutuskan kapan harus memanggil Fusion saat model dasar menghadapi masalah yang membutuhkan penelitian mendalam (seperti pengambilan keputusan arsitektur, studi praktik terbaik), sementara penulisan kode sehari-hari tetap dilakukan oleh model utama.

Empat cara panggil dalam satu panduan

Pengembang dapat menggunakan Fusion melalui empat cara berikut:

  • Chatroom coba-coba: langsung ke openrouter.ai/fusion, pilih preset atau buat panel sendiri
  • Model slug: di API tentukan "model": "openrouter/fusion", otomatis menggunakan panel terdepan yang sudah disiapkan
  • Server tool: tambahkan dalam array tools {"type": "openrouter:fusion"} agar model utama memutuskan kapan harus memanggil
  • Mode plugin: tambahkan parameter plugins dalam panggilan API, untuk kustomisasi kombinasi panel dan model

Panel default Fusion memiliki biaya panggilan sekitar 50% lebih rendah dari Fable, tetapi waktu respons sekitar 2-3 kali lipat dari panggilan standar (karena harus menunggu inferensi paralel beberapa model lalu digabungkan). OpenRouter menyatakan akan terus meningkatkan performa berdasarkan umpan balik pengguna.

Artikel ini berasal dari OpenRouter Blog, disusun dan diterjemahkan oleh 動區動趨.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan