Seri Xiaomi MiMo-V2.5 Open-Source: 1T Parameter di bawah Lisensi MIT, Efisiensi Token Mengungguli GPT-5.4 di ClawEval

robot
Pembuatan abstrak sedang berlangsung

Menurut pemantauan oleh Dongcha Beating, tim Xiaomi MiMo telah merilis sumber terbuka seri model besar MiMo-V2.5, yang mencakup dua model, keduanya berlisensi MIT, mendukung penerapan komersial, pelatihan lanjutan, dan penyempurnaan, dengan jendela konteks hingga 1 juta token. MiMo-V2.5-Pro adalah model MoE teks murni (arsitektur Campuran Ahli) dengan total 1,02 triliun parameter dan 42 miliar parameter aktif; MiMo-V2.5 adalah model multimodal asli dengan total 310 miliar parameter dan 15 miliar parameter aktif, mendukung pemahaman teks, gambar, video, dan audio. MiMo-V2.5-Pro terutama menargetkan tugas agen kompleks dan pemrograman. Dalam evaluasi ClawEval, V2.5-Pro mencapai tingkat keberhasilan 64%, mencapai tingkat yang sebanding sambil mengkonsumsi hanya sekitar 70.000 token per trajektori tugas, yang sekitar 40% hingga 60% lebih sedikit dibandingkan Claude Opus 4.6, Gemini 3.1 Pro, dan GPT-5.4. Skor Verified SWE-bench adalah 78,9. Dalam sebuah kasus yang dipamerkan di blog resmi, V2.5-Pro secara otomatis mengimplementasikan compiler lengkap dari SysY ke RISC-V untuk proyek prinsip-prinsip compiler di Universitas Peking, memakan waktu 4,3 jam dan 672 panggilan alat, mencapai skor sempurna 233/233 pada set pengujian tersembunyi. MiMo-V2.5 dirancang untuk skenario agen multimodal, dilengkapi dengan encoder visual khusus (ViT 729 juta parameter) dan encoder audio (261 juta parameter), dengan skor 62,3 pada subset umum Claw-Eval. Kedua model menggunakan arsitektur campuran perhatian jendela geser (SWA) dan perhatian global (GA), bersama dengan modul prediksi multi-token 3-lapisan (MTP) (memprediksi beberapa token sekaligus untuk mempercepat inferensi). Bobot telah dirilis di Hugging Face. Bersamaan dengan rilis sumber terbuka, tim MiMo telah meluncurkan ‘Program Insentif Pembuat Triliun Token Orbit’, menawarkan total kuota 100 triliun token secara gratis kepada pengguna global dalam 30 hari. Pengembang individu, tim, dan perusahaan dapat mengajukan permohonan di halaman acara, dengan periode evaluasi sekitar 3 hari kerja. Setelah disetujui, manfaat akan dikreditkan dalam bentuk Rencana Token atau hibah, yang dapat langsung digunakan dengan alat pemrograman seperti Claude Code dan Cursor.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan