Tidak menyentuh bobot, hanya mengandalkan cheat untuk membuat Kimi dari 50 melambung ke 79, jalur ini terlalu liar

Lihat Asli
MeNews
Tanpa menyentuh bobot, penyesuaian API murni: Poetiq「Modul Tambahan」membantu Kimi meningkat 29,9 poin persentase, versi ringan Gemini melawan balik Claude Opus
Poetiq tim enam orang Meta-System di LiveCodeBench Pro memecahkan rekor tertinggi. Ekstensi API murni ini melalui peningkatan diri secara rekursif untuk mengekstrak pengalaman tugas, tanpa menyentuh bobot atau penyesuaian kecil, mampu meningkatkan model lemah secara signifikan. Setelah terintegrasi, KimiK2.6 meningkat dari 50,0% menjadi 79,9%, Gemini3.0 Flash bertambah 10 poin, bahkan melampaui Gemini3.1 Pro, Claude Opus4.7, GPT5.2 High. GPT5.5 High mencapai 93,9% melalui ekstensi, Gemini3.1 Pro dikombinasikan mencapai 90,9%, melampaui Gemini3 Deep Think. Perusahaan tidak perlu penyesuaian kecil biaya tinggi untuk meningkatkan kemampuan penalaran.
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan