Penilaian independen menunjukkan bahwa MiniMax M2.7 setara dengan model terdepan tertutup dalam tugas agen inti

robot
Pembuatan abstrak sedang berlangsung

Berita ME News, pada 5 April (UTC+8), baru-baru ini, berdasarkan evaluasi independen LangChain, model open-weight MiniMax M2.7 telah mencapai tingkat yang setara dengan model frontier yang bersifat tertutup pada tugas agen inti seperti operasi berkas, pemanggilan alat, dan kepatuhan terhadap instruksi. Menurut pandangan yang dimuat dalam artikel tersebut, keunggulannya terletak pada penurunan biaya yang signifikan sekitar 20 kali, dengan peningkatan kecepatan 2–4 kali. Sebagai contoh, dengan output harian sebesar 10 juta token, biaya menggunakan Opus 4.6 adalah sekitar 250 dolar AS/hari, sedangkan MiniMax M2.7 hanya memerlukan sekitar 12 dolar AS/hari. Kemajuan ini berkat dorongan dari tolok ukur terbuka seperti SWE-Rebench dan Terminal Bench 2.0, yang membuat model terbuka menjadi pilihan yang layak untuk penerapan agen di lingkungan produksi, serta dapat digunakan secara kolaboratif dengan model tertutup. (Sumber: InFoQ)

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan