Penilaian independen menunjukkan bahwa MiniMax M2.7 setara dengan model terdepan tertutup dalam tugas agen inti

robot
Pembuatan abstrak sedang berlangsung

Berita ME, pesan 5 April (UTC+8). Baru-baru ini, berdasarkan penilaian independen dari LangChain, model bobot terbuka MiniMax M2.7 telah mencapai tingkat yang sebanding dengan model-model terdepan yang tertutup pada tugas-tugas agen inti seperti operasi berkas, pemanggilan alat, dan kepatuhan terhadap instruksi. Pandangan dalam artikel tersebut menyatakan bahwa keunggulannya adalah biaya yang turun secara signifikan sekitar 20 kali, dengan kecepatan meningkat 2-4 kali. Sebagai contoh, dengan keluaran 10 juta token per hari, biaya menggunakan Opus 4.6 sekitar 250 dolar AS per hari, sedangkan MiniMax M2.7 hanya memerlukan sekitar 12 dolar AS per hari. Kemajuan ini berkat dorongan dari tolok ukur terbuka seperti SWE-Rebench dan Terminal Bench 2.0, yang menjadikan model terbuka sebagai pilihan yang layak untuk menerapkan agen di lingkungan produksi, serta dapat digunakan bersamaan dengan model tertutup. (Sumber: InFoQ)

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan