MiniMax annonce le grand modèle M3 : capacité de programmation surpassant GPT-5.5, supporte le contrôle multimodal natif sur bureau

Le site Web de Coinjie annonce que MiniMax a officiellement lancé aujourd'hui le grand modèle M3.
M3 est actuellement le seul grand modèle open source intégrant les trois éléments de pointe : programmation complète, contexte ultra-long et multimodal natif, avec un plan de publication des poids dans les 10 jours.
Il atteint un niveau de pointe international dans la génération de code, les agents intelligents et la manipulation de bureau, accessible via MiniMax code, token plan et API.
M3 innove avec l'architecture d'attention sparse MSA, qui agrège les requêtes via des blocs KV, rendant la recherche mémoire 4 fois plus rapide que Flash-sparse-attention.
Avec un contexte d'environ un million, cette nouvelle architecture réduit la charge de calcul par token à un vingtième de celle de la génération précédente, réalisant une accélération de 9 fois pour le pré-remplissage et 15 fois pour le décodage.
Sur le benchmark SWE-bench pro, M3 a obtenu un score de 59,0 %, surpassant GPT-5.5 et Gemini 3.1 pro, et approchant Opus 4.7.
Dans la tâche d'optimisation FP8 du Hopper, en 24 heures, il a appelé l'outil 1959 fois de manière autonome, augmentant le taux d'utilisation du matériel de 7,6 % à 71,3 %, avec une accélération de 9,4 fois.
L'API est désormais en ligne, offrant des modes d'inférence et rapide, avec un plan de publication des poids dans les 10 jours.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 8
  • 1
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
ThereIsTvlInTheWind
· Il y a 5h
SWE-bench pro 59% dépasse GPT-5.5, la capacité en codage s'est vraiment améliorée
Voir l'originalRépondre0
SymbolsInTheReflection
· Il y a 5h
L'architecture MSA permet un accès mémoire 4 fois plus rapide, Flash-sparse-attention devient le panneau de fond.
Voir l'originalRépondre0
ThereAreCatsInTheContract.
· Il y a 5h
Requête de recherche sur la correspondance de la requête d'agrégation de blocs KV, détails techniques et autres aspects des articles académiques
Voir l'originalRépondre0
PerpPulse
· Il y a 5h
Gemini 3.1 a été dépassé ? La pression vient de Google
Voir l'originalRépondre0
TeaAndSlippage
· Il y a 5h
Programmation + contexte ultra-long + multimodalité native intégrée, une voie open source unique
Voir l'originalRépondre0
GateUser-f7b40cee
· Il y a 5h
Le code MiniMax et l'API sont désormais disponibles en version d'essai, il suffit de foncer.
Voir l'originalRépondre0
DuskStop-LossLine
· Il y a 5h
Le contrôle de bureau est à la pointe de l'international, l'agent IA progresse encore dans sa mise en œuvre
Voir l'originalRépondre0
AirdropMileCounter
· Il y a 5h
Le décodage pré-rempli 9 fois, le décodage 15 fois, cette accélération est vraiment incroyable
Voir l'originalRépondre0
  • Épinglé