Sakana AI merilis sistem multi-agen Fugu: skor melewati GPT5.4 dan Opus4.6

Laporan dari Jinse Caijing, perusahaan pengembangan AI Jepang Sakana AI mengumumkan peluncuran produk komersial utama Sakana Fugu, dan membuka pendaftaran untuk uji coba Beta awal.
Sistem ini ditujukan sebagai sistem pengaturan multi-agen, menyediakan layanan dalam bentuk API model tunggal yang kompatibel dengan format OpenAI, termasuk Sakana Fugu Mini yang dioptimalkan untuk latensi rendah dan Sakana Fugu Ultra yang ditujukan untuk tugas-tugas berat.
Arsitektur produk didasarkan pada makalah Trinity dan Conductor yang dipublikasikan tim di ICLR 2026.
Inti dari sistem ini adalah model bahasa ringan yang belajar secara mandiri, tanpa bergantung pada peran tim yang dipra-setel secara manual atau jalur produksi tetap, melainkan secara dinamis memanggil kolam model Worker dan membagi tugas sesuai tingkat kesulitan tugas.
Sistem ini juga mendukung penskalaan saat pengujian, memiliki kemampuan panggilan rekursif yang adaptif.
Model dapat membaca output sebelumnya sebagai konteks, sehingga mampu secara mandiri mengidentifikasi kekurangan selama proses berjalan dan memulai alur kerja koreksi, pengguna dapat mengatur kedalaman rekursi sebagai parameter daya komputasi yang dapat disesuaikan saat inferensi.
Data evaluasi menunjukkan bahwa dalam pengujian dasar inferensi dan pengkodean yang intensif, Sakana Fugu Ultra menunjukkan performa yang melampaui model tunggal terdepan.
Dalam pengujian GPQAD, LCBv6, dan SWEPro, Sakana Fugu Ultra meraih skor masing-masing 95.1, 93.2, dan 54.2, mengungguli model flagship utama seperti GPT 5.4, Gemini 3.1, dan Opus 4.6.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan