Xiaomi dan MiniMax secara bersamaan meluncurkan langkah besar, perang harga Agent resmi dimulai

robot
Pembuatan abstrak sedang berlangsung

Judul Asli: Xiaomi dan MiniMax Secara Bersamaan Meluncurkan Inovasi, Perang Harga Agent Resmi Dimulai

Penulis Asli:律动BlockBeats

Sumber Asli:

Reprint: Mars Finance

Pada tanggal 18 dan 19 Maret, dua perusahaan China secara berurutan merilis model besar untuk arah Agent mereka masing-masing. Startup AI domestik MiniMax meluncurkan M2.7, sementara tim model besar di bawah Xiaomi, MiMo, meluncurkan V2-Pro. Kedua model ini masuk ke peringkat teratas global dalam benchmark Agent, tetapi harga output API mereka masing-masing adalah 1/21 dan 1/8 dari Claude Opus 4.6.

Kedua perusahaan ini mengeluarkan produk dalam minggu yang sama, tetapi strategi mereka sangat berbeda. Mereka mewakili dua jalur teknologi yang sama sekali berbeda, bertaruh pada dua masa depan era Agent.

Ujian yang Sama, Biaya 1/17

Pertama, mari lihat perbandingan yang paling langsung.

Berdasarkan data dari OpenRouter dan halaman harga resmi masing-masing perusahaan, dengan harga output API (per juta token), MiniMax M2.7 adalah 1,2 dolar, dan MiMo V2-Pro adalah 3 dolar. Sebagai referensi, harga output Claude Opus 4.6 adalah 25 dolar, GPT-5.2 adalah 14 dolar, dan Claude Sonnet 4.6 adalah 15 dolar.

Perbedaan harga sangat besar, tetapi perbedaan kemampuan tidak. Dalam SWE-bench Verified (benchmark yang saat ini paling umum digunakan untuk mengukur kemampuan pengkodean), MiMo V2-Pro mendapatkan 78%, Sonnet 4.6 mendapatkan 79,6%, selisih kurang dari dua poin persentase. Nilai SWE-Pro dari M2.7 adalah 56,22%, setara dengan GPT-5.3-Codex. Dalam VIBE-Pro (kemampuan pengiriman proyek end-to-end), M2.7 mendapatkan 55,6%, mendekati level Opus 4.6.

Fokus gambar ini bukan pada siapa yang lebih tinggi atau lebih rendah—sistem benchmark masing-masing tidak sepenuhnya sejajar, jadi perbandingan langsung harus dilakukan dengan hati-hati. Intinya adalah pada “kesenjangan harga-kinerja”: model Agent domestik sudah masuk ke dalam rentang kemampuan yang sama, tetapi berada di kisaran harga yang sangat berbeda.

Triliunan Parameter vs Evolusi Mandiri

Harga hanyalah tampilan luar. Kedua perusahaan menunjukkan dua strategi yang benar-benar berbeda.

MiMo V2-Pro mengikuti jalur “hasil besar dari usaha keras”. Menurut pengumuman resmi Xiaomi, V2-Pro memiliki lebih dari 1 triliun parameter total, dengan aktivasi parameter 42B, mendukung konteks panjang hingga 1 juta token. Inovasi utamanya adalah mekanisme Hybrid Attention, yang menggabungkan perhatian jendela geser (SWA) dan perhatian global (GA) dengan rasio 7:1—versi sebelumnya, V2-Flash, rasio 5:1. Arsitektur ini membuat model lebih stabil saat menangani dokumen panjang dan panggilan alat yang paralel dalam skenario Agent. Dalam PinchBench (pengujian kemampuan panggilan alat Agent), MiMo V2-Pro meraih skor 84%.

M2.7 mengikuti jalur yang sama sekali berbeda. Menurut blog teknis resmi MiniMax yang dirilis pada 18 Maret, jumlah parameter M2.7 tidak diumumkan, tetapi menunjukkan mekanisme “evolusi otomatis” yang memungkinkan model menjalankan lebih dari 100 siklus optimisasi mandiri, termasuk analisis jalur kegagalan, perencanaan modifikasi, modifikasi arsitektur kode sendiri, evaluasi, dan pengulangan, akhirnya meningkatkan performa sebesar 30% di set evaluasi internal. Dalam 22 soal tingkat tinggi di MLE Bench Lite (pengujian tingkat kompetisi pembelajaran mesin), M2.7 meraih 9 medali emas, 5 perak, dan 1 perunggu, dengan tingkat perolehan medali rata-rata 66,6%.

Dari lima dimensi, kedua jalur ini sangat berbeda: MiMo V2-Pro unggul dalam panjang konteks dan pengembangan kode, sementara M2.7 unggul dalam otomatisasi kerja dan kemampuan evolusi mandiri. Menurut blog teknis MiniMax yang sama, M2.7 meraih ELO 1495 dalam pengujian pengolahan dokumen kantor GDPval-AA, posisi teratas di model sumber terbuka, dan mempertahankan tingkat kepatuhan terhadap 97% dari lebih dari 40 keterampilan kompleks dalam pengujian MM-Claw.

Lima Bulan Empat Versi

Selain jalur teknologi yang berbeda, ritme iterasi mereka juga sangat berbeda.

Berdasarkan catatan rilis resmi, MiniMax merilis M2 pada Oktober 2025 dan M2.7 pada Maret 2026, dalam lima bulan mereka telah melakukan empat iterasi besar, rata-rata setiap 49 hari satu versi besar. Antara M2.5 dan M2.7 hanya berjarak sekitar 30 hari.

Sementara itu, Xiaomi mengikuti ritme berbeda: merilis MiMo-7B (model inferensi sumber terbuka dengan 7B parameter) pada April 2025, kemudian V2-Flash (total parameter 309B) pada Desember tahun yang sama, dan V2-Pro (total parameter 1T) pada Maret 2026. Setiap generasi memiliki skala parameter yang lebih besar, tetapi jarak antar versinya juga lebih panjang.

MiniMax memilih pendekatan langkah kecil dan cepat, dengan frekuensi sangat tinggi, dan mekanisme evolusi mandiri M2.7 dirancang untuk “terus berkembang”. Xiaomi memilih pendekatan yang lebih agresif, dengan setiap versi mengalami lonjakan besar dalam skala parameter dan arsitektur.

Anonim dalam 8 Hari, Mendominasi OpenRouter

Selain jalur teknologi, strategi peluncuran Xiaomi juga memecahkan kebiasaan industri.

Menurut Reuters, pada 11 Maret, sebuah model anonim bernama Hunter Alpha muncul di platform agregator API terbesar, OpenRouter. Tanpa dukungan merek, tanpa konferensi peluncuran, tanpa blog teknis. Harga API-nya sangat rendah, tetapi performanya mengejutkan.

Komunitas mulai menebak asal-usulnya. Menurut Republic World dan beberapa media teknologi, tebakan paling umum adalah DeepSeek V4, karena kepala tim MiMo, Luo Fuli, sebelumnya pernah bekerja di DeepSeek. Volume panggilan meningkat pesat, selama periode anonim total panggilan melewati 1 triliun tokens, dan menduduki peringkat pertama di OpenRouter.

Pada dini hari 19 Maret, Xiaomi mengungkapkan: Hunter Alpha sebenarnya adalah MiMo V2-Pro. Menurut laporan Reuters yang sama, setelah pengungkapan tersebut, saham Xiaomi di Hong Kong sempat naik hingga 5,8%.

Ini adalah kali pertama model besar domestik membuktikan kemampuannya di platform global secara blind test murni. Tanpa bergantung merek, tanpa promosi, dalam waktu 8 hari mereka membiarkan pengembang memilih dengan tindakan mereka sendiri.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan