Le 18 et 19 mars, deux entreprises chinoises ont respectivement lancé leurs propres modèles d'Agent de grande taille : MiniMax M2.7 et MiMo V2-Pro de Xiaomi, avec des prix et des stratégies techniques radicalement différents. MiniMax se concentre sur l'itération et l'évolution autonomes, avec une itération rapide, tandis que Xiaomi suit une stratégie de grands paramètres, mettant l'accent sur la stabilité et la capacité de traitement de longs documents. Avec des performances comparables entre les deux modèles, l'écart de prix est notable, offrant différentes possibilités pour le développement futur de l'ère de l'Agent.

SmartContractAuditor

2026-03-20 04:01:11

Création du résumé en cours

Le 18 et 19 mars, deux entreprises chinoises ont successivement publié leurs grands modèles axés sur l'Agent. La startup d'IA locale MiniMax a lancé M2.7, et l'équipe de grands modèles de Xiaomi, MiMo, a présenté V2-Pro. Ces deux modèles figurent tous deux dans la première rangée mondiale sur l'Agent benchmark, mais leurs prix d'API (par millions de tokens) sont respectivement de 1/21 et 1/8 de Claude Opus 4.6.

Les deux entreprises ont lancé leurs produits la même semaine, mais leurs stratégies sont complètement différentes. Elles représentent deux trajectoires technologiques distinctes, jouant deux futurs possibles pour l'ère de l'Agent.

Même examen, 1/17 de frais de scolarité

Voyons d'abord la comparaison la plus évidente.

Selon les données d'OpenRouter et des pages officielles de chaque entreprise, en termes de prix d'API (par million de tokens), MiniMax M2.7 coûte 1,2 USD, et MiMo-V2-Pro coûte 3 USD. En comparaison, le prix de sortie de Claude Opus 4.6 est de 25 USD, GPT-5.2 de 14 USD, et Claude Sonnet 4.6 de 15 USD.

L'écart de prix est de plusieurs ordres de grandeur, mais la différence de performance ne l'est pas. Sur SWE-bench Verified (le benchmark le plus courant pour mesurer la capacité en ingénierie logicielle), MiMo-V2-Pro obtient 78 %, Sonnet 4.6 79,6 %, avec moins de deux points de différence. M2.7 affiche un score SWE-Pro de 56,22 %, équivalent à GPT-5.3-Codex. Sur VIBE-Pro (évaluation de la capacité de livraison de projets de bout en bout), M2.7 atteint 55,6 %, proche du niveau d'Opus 4.6.

L'objectif de cette illustration n'est pas de déterminer qui est meilleur — les systèmes de benchmark ne sont pas parfaitement alignés, donc la comparaison directe doit être prudente. L'essentiel réside dans cette « différence de prix-performance » : les modèles d'Agent nationaux ont déjà atteint un même niveau de capacité, mais dans des plages de prix totalement différentes.

Paramètres de l'ordre du trillion vs auto-évolution

Le prix n'est qu'une apparence. Les deux entreprises ont dévoilé deux stratégies radicalement différentes.

MiMo-V2-Pro suit la voie du « grand effort, miracle ». Selon une annonce officielle de Xiaomi, V2-Pro possède plus d’un trillion de paramètres au total, avec 42 milliards de paramètres activés, et supporte un contexte ultra-long de 1 million de tokens. Son innovation principale est le mécanisme d'attention hybride (Hybrid Attention), combinant l'attention par fenêtre glissante (SWA) et l'attention globale (GA) dans un ratio de 7:1 — la version précédente V2-Flash utilisait un ratio de 5:1. Cette architecture permet au modèle d’être plus stable lors du traitement de longs documents ou de scénarios d’Agent avec plusieurs outils en parallèle. Sur PinchBench (évaluation de la capacité d’appel d’outils d’Agent), MiMo-V2-Pro obtient 84 %.

M2.7 emprunte une voie totalement différente. Selon le blog technique officiel publié par MiniMax le 18 mars, le nombre de paramètres de M2.7 n’a pas été divulgué, mais il présente un mécanisme d’« évolution auto-iterative » : le modèle effectue plus de 100 cycles d’optimisation autonomes, comprenant l’analyse des trajectoires d’échec, la planification de modifications, la modification de sa propre architecture, l’évaluation, puis la boucle recommence, aboutissant à une amélioration de 30 % des performances sur un ensemble d’évaluation interne. Sur le MLE Bench Lite (évaluation de difficulté pour les compétitions d’apprentissage automatique), M2.7 a obtenu 9 médailles d’or, 5 d’argent et 1 de bronze, avec un taux de médailles moyen de 66,6 %.

Du point de vue de cinq dimensions, ces deux trajectoires sont diamétralement opposées : MiMo-V2-Pro domine clairement en longueur de contexte et en capacité de gestion de code, tandis que M2.7 se distingue par l’automatisation de bureau et la capacité d’auto-optimisation. Selon le même blog technique de MiniMax, M2.7 a obtenu un score ELO de 1495 sur GDPval-AA (évaluation de traitement de documents bureautiques), en tête des modèles open source, et a maintenu un taux de conformité de 97 % dans le test MM-Claw, couvrant plus de 40 compétences complexes.

Cinq mois, quatre versions

Les deux entreprises ne diffèrent pas seulement par leur trajectoire technologique, mais aussi par leur rythme d’itération.

Selon les archives publiques, MiniMax a lancé M2 en octobre 2025, puis M2.7 en mars 2026, en l’espace de cinq mois, avec quatre versions majeures, chaque 49 jours en moyenne. La transition de M2.5 à M2.7 n’a duré qu’environ 30 jours.

Xiaomi, quant à elle, a un rythme différent : en avril 2025, elle a publié MiMo-7B (modèle de raisonnement open source de 7 milliards de paramètres), puis en décembre de la même année V2-Flash (total de 309 milliards de paramètres), et en mars 2026 V2-Pro (1 trillion de paramètres). Chaque génération voit une augmentation significative de la taille, mais l’intervalle entre les versions est plus long.

MiniMax privilégie une approche de petites étapes rapides, avec des améliorations modestes mais fréquentes. La mécanique d’auto-optimisation de M2.7 est conçue pour une « évolution continue ». Xiaomi, elle, opte pour une stratégie de puissance concentrée, avec chaque version marquée par une grande avancée en termes de paramètres et d’architecture.

Anonyme en 8 jours, en tête d’OpenRouter

Au-delà de la stratégie technologique, la stratégie de lancement de Xiaomi brise également les conventions du secteur.

Selon Reuters, le 11 mars, un modèle anonyme nommé Hunter Alpha est apparu sur OpenRouter, la plus grande plateforme d’agrégation d’API. Sans marque, sans conférence, sans blog technique. Son prix d’API est très bas, mais ses performances sont étonnamment élevées.

La communauté a commencé à spéculer sur son origine. Selon Republic World et plusieurs médias technologiques, la supposition la plus répandue est qu’il s’agit de DeepSeek V4, car le responsable de l’équipe MiMo, Luo Fuli, a précédemment travaillé chez DeepSeek. Le volume d’appels a rapidement augmenté, dépassant 1 trillion de tokens durant la période anonyme, et il a atteint la première place du classement hebdomadaire d’OpenRouter.

Le 19 mars au matin, Xiaomi a révélé : Hunter Alpha est en réalité le MiMo-V2-Pro. Selon le même rapport de Reuters, après cette révélation, l’action de Xiaomi à Hong Kong a brièvement augmenté de 5,8 %.

C’est la première fois qu’un grand modèle national prouve ses capacités sur une plateforme mondiale en mode totalement aveugle. Sans marque, sans publicité, en seulement 8 jours, les développeurs ont voté avec leurs pieds.

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

Récompense
J'aime
Commentaire
Reposter
Partager

Commentaire

Ajouter un commentaire

Aucun commentaire

Sujets populaires
Afficher plus
#
TradfiTradingChallenge
271.84K Popularité
#
PlatinumCardCreatorExclusive
81.55K Popularité
#
IsraelStrikesIranBTCPlunges
48.62K Popularité
#
#DailyPolymarketHotspot
1.03M Popularité
#
GateSquarePizzaDay
1.75M Popularité

Épinglé

Xiaomi et MiniMax lancent simultanément leurs coups majeurs, la guerre des prix des Agents commence officiellement

Même examen, 1/17 de frais de scolarité

Paramètres de l'ordre du trillion vs auto-évolution

Cinq mois, quatre versions

Anonyme en 8 jours, en tête d’OpenRouter

Sujets populaires

TradfiTradingChallenge

PlatinumCardCreatorExclusive

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

GateSquarePizzaDay

Épinglé