Xiaomi dan MiniMax Meluncurkan Strategi Besar, Perang Harga Agent Resmi Dimulai

robot
Pembuatan abstrak sedang berlangsung

18 dan 19 Maret, dua perusahaan China secara berurutan merilis model besar yang berfokus pada Agent. Perusahaan startup AI domestik MiniMax meluncurkan M2.7, sementara tim model besar di bawah Xiaomi, MiMo, meluncurkan V2-Pro. Kedua model ini masuk ke dalam tier pertama global di benchmark Agent, tetapi harga output API mereka masing-masing adalah 1/21 dan 1/8 dari Claude Opus 4.6.

Kedua perusahaan ini mengeluarkan produk dalam minggu yang sama, tetapi kartu yang mereka pegang sangat berbeda. Mereka mewakili dua jalur teknologi yang sama sekali berbeda, bertaruh pada dua masa depan yang berbeda dalam era Agent.

Ujian yang sama, biaya 1/17

Mari kita lihat perbandingan yang paling langsung.

Berdasarkan data dari OpenRouter dan halaman harga resmi masing-masing perusahaan, dihitung berdasarkan harga output API (per juta token), MiniMax M2.7 adalah 1,2 dolar AS, dan MiMo-V2-Pro adalah 3 dolar AS. Sebagai referensi, harga output Claude Opus 4.6 adalah 25 dolar AS, GPT-5.2 adalah 14 dolar AS, dan Claude Sonnet 4.6 adalah 15 dolar AS.

Perbedaan harga ini berskala besar, tetapi perbedaan kemampuan tidak. Di SWE-bench Verified (benchmark yang saat ini paling umum digunakan untuk mengukur kemampuan pengembangan kode), MiMo-V2-Pro mendapatkan skor 78%, Sonnet 4.6 mendapatkan 79,6%, selisih kurang dari dua poin persentase. Nilai SWE-Pro dari M2.7 adalah 56,22%, setara dengan GPT-5.3-Codex. Di VIBE-Pro (kemampuan pengiriman proyek end-to-end), M2.7 mendapatkan 55,6%, mendekati level Opus 4.6.

Fokus dari gambar ini bukan siapa yang lebih tinggi atau lebih rendah—sistem benchmark masing-masing tidak sepenuhnya sejajar, jadi perbandingan langsung harus dilakukan dengan hati-hati. Intinya adalah pada "perbedaan harga-kinerja" yang mencolok: model Agent domestik sudah masuk ke dalam rentang kemampuan yang sama, tetapi berada di kisaran harga yang sangat berbeda.

Triliunan parameter vs evolusi diri

Harga hanyalah penampilan luar. Kedua perusahaan ini menampilkan dua set strategi yang benar-benar berbeda.

MiMo-V2-Pro mengikuti jalur "kekuatan besar menghasilkan keajaiban". Menurut pengumuman resmi Xiaomi, V2-Pro memiliki lebih dari 1 triliun parameter total, dengan parameter aktif 42B, dan mendukung konteks panjang hingga 1 juta token. Inovasi utamanya adalah mekanisme Hybrid Attention, yang menggabungkan perhatian jendela geser (SWA) dan perhatian global (GA) dengan rasio 7:1—versi sebelumnya, V2-Flash, rasio 5:1. Arsitektur ini membuat model lebih stabil saat menangani dokumen panjang dan skenario Agent yang melibatkan banyak alat secara paralel. Di PinchBench (pengukuran kemampuan panggilan alat Agent), MiMo-V2-Pro meraih skor 84%.

M2.7 mengikuti jalur yang sama sekali berbeda. Menurut blog teknis resmi yang dirilis MiniMax pada 18 Maret, jumlah parameter M2.7 tidak diumumkan, tetapi model ini menampilkan mekanisme "evolusi otomatis" yang memungkinkan model menjalankan lebih dari 100 siklus optimisasi mandiri, termasuk menganalisis jalur kegagalan, merencanakan modifikasi, mengubah arsitektur kode sendiri, melakukan evaluasi, dan mengulangi proses tersebut, akhirnya meningkatkan performa sebesar 30% di set evaluasi internal. Dari 22 soal tingkat tinggi di MLE Bench Lite (pengukuran tingkat kesulitan kompetisi machine learning), M2.7 meraih 9 medali emas, 5 perak, dan 1 perunggu, dengan rata-rata tingkat medali 66,6%.

Dari lima dimensi, kedua jalur ini menunjukkan keunggulan yang sangat berbeda: MiMo-V2-Pro unggul dalam panjang konteks dan pengembangan kode, sementara M2.7 unggul dalam otomatisasi kantor dan kemampuan evolusi diri. Menurut blog teknis yang sama dari MiniMax, M2.7 meraih skor ELO 1495 di GDPval-AA (pengukuran pengolahan dokumen kantor), posisi teratas di model open-source, dan mempertahankan tingkat kepatuhan terhadap 97% dari lebih 40 skill kompleks di tes MM-Claw.

Lima bulan, empat versi

Kedua perusahaan tidak hanya berbeda dalam jalur teknologi, tetapi juga dalam ritme iterasi.

Berdasarkan catatan rilis yang dipublikasikan, MiniMax merilis M2 pada Oktober 2025 dan kemudian M2.7 pada Maret 2026, dalam waktu lima bulan mereka mengembangkan empat versi, dengan rata-rata setiap 49 hari rilis versi besar. Selisih antara M2.5 dan M2.7 hanya sekitar 30 hari.

Sementara itu, Xiaomi dengan MiMo mengikuti ritme yang berbeda: merilis MiMo-7B (model inferensi open-source dengan 7B parameter) pada April 2025, kemudian V2-Flash (total parameter 309B) pada Desember tahun yang sama, dan V2-Pro (total parameter 1T) pada Maret 2026. Setiap generasi memiliki skala parameter yang jauh lebih besar, tetapi jarak antar versinya juga lebih panjang.

MiniMax memilih pendekatan langkah kecil dan cepat, dengan iterasi yang tidak besar tetapi sangat sering, dan mekanisme evolusi otomatis M2.7 dirancang untuk "terus berkembang". Xiaomi memilih pendekatan yang lebih kuat sekaligus: setiap versi adalah loncatan besar dalam skala parameter dan arsitektur.

Anonim 8 hari, puncaki OpenRouter

Selain jalur teknologi, strategi peluncuran Xiaomi juga mematahkan kebiasaan industri.

Menurut Reuters, pada 11 Maret, sebuah model anonim bernama Hunter Alpha muncul di platform agregasi API terbesar, OpenRouter. Tanpa dukungan merek, tanpa konferensi peluncuran, tanpa blog teknis. Harga API-nya sangat rendah, tetapi performanya luar biasa.

Komunitas mulai menebak asal-usulnya. Berdasarkan laporan dari Republic World dan berbagai media teknologi, tebakan paling umum adalah DeepSeek V4, karena kepala tim MiMo, Luo Fuli, sebelumnya pernah melakukan riset di DeepSeek. Volume panggilan meningkat pesat, selama masa anonim total panggilan melewati 1 triliun token, dan model ini menduduki puncak peringkat mingguan OpenRouter.

Dini hari 19 Maret, Xiaomi mengumumkan: Hunter Alpha adalah MiMo-V2-Pro. Menurut laporan Reuters yang sama, setelah pengumuman tersebut, saham Xiaomi di Hong Kong sempat naik hingga 5,8%.

Ini adalah kali pertama model besar domestik membuktikan kemampuannya di platform global secara blind test murni. Tanpa mengandalkan merek, tanpa promosi, dalam waktu 8 hari mereka membiarkan para pengembang "menggunakan kaki mereka untuk memilih".

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan