Le site Web de Coinjie annonce que MiniMax a officiellement lancé aujourd'hui le grand modèle M3.
M3 est actuellement le seul grand modèle open source intégrant les trois éléments de pointe : programmation complète, contexte ultra-long et multimodal natif, avec un plan de publication des poids dans les 10 jours.
Il atteint un niveau de pointe international dans la génération de code, les agents intelligents et la manipulation de bureau, accessible via MiniMax code, token plan et API.
M3 innove avec l'architecture d'attention sparse MSA, qui agrège les requêtes via des blocs KV, rendant la recherche mémoire 4 fois plus rapide que Flash-sparse-attention.
Avec un contexte d'environ un million, cette nouvelle architecture réduit la charge de calcul par token à un vingtième de celle de la génération précédente, réalisant une accélération de 9 fois pour le pré-remplissage et 15 fois pour le décodage.
Sur le benchmark SWE-bench pro, M3 a obtenu un score de 59,0 %, surpassant GPT-5.5 et Gemini 3.1 pro, et approchant Opus 4.7.
Dans la tâche d'optimisation FP8 du Hopper, en 24 heures, il a appelé l'outil 1959 fois de manière autonome, augmentant le taux d'utilisation du matériel de 7,6 % à 71,3 %, avec une accélération de 9,4 fois.
L'API est désormais en ligne, offrant des modes d'inférence et rapide, avec un plan de publication des poids dans les 10 jours.

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

8 J'aime

Récompense
8
8
1
Partager

Commentaire

Ajouter un commentaire

ThereIsTvlInTheWind

· Il y a 5h

SWE-bench pro 59% dépasse GPT-5.5, la capacité en codage s'est vraiment améliorée

Voir l'originalRépondre0

SymbolsInTheReflection

· Il y a 5h

L'architecture MSA permet un accès mémoire 4 fois plus rapide, Flash-sparse-attention devient le panneau de fond.

Voir l'originalRépondre0

ThereAreCatsInTheContract.

· Il y a 5h

Requête de recherche sur la correspondance de la requête d'agrégation de blocs KV, détails techniques et autres aspects des articles académiques

Voir l'originalRépondre0

PerpPulse

· Il y a 5h

Gemini 3.1 a été dépassé ? La pression vient de Google

Voir l'originalRépondre0

TeaAndSlippage

· Il y a 5h

Programmation + contexte ultra-long + multimodalité native intégrée, une voie open source unique

Voir l'originalRépondre0

GateUser-f7b40cee

· Il y a 5h

Le code MiniMax et l'API sont désormais disponibles en version d'essai, il suffit de foncer.

Voir l'originalRépondre0

DuskStop-LossLine

· Il y a 5h

Le contrôle de bureau est à la pointe de l'international, l'agent IA progresse encore dans sa mise en œuvre

Voir l'originalRépondre0

AirdropMileCounter

· Il y a 5h

Le décodage pré-rempli 9 fois, le décodage 15 fois, cette accélération est vraiment incroyable

Voir l'originalRépondre0

Sujets populaires
Afficher plus
#
IntroducingGateStocks
34.5M Popularité
#
WinGoldBarsWithGrowthPoints
1.26M Popularité
#
IsraelStrikesIranBTCPlunges
51.75K Popularité
#
ArthurHayesSeesHYPEOvertakingSOL
18.19M Popularité
#
USIranNegotiationGame
9.57M Popularité

Épinglé

MiniMax annonce le grand modèle M3 : capacité de programmation surpassant GPT-5.5, supporte le contrôle multimodal natif sur bureau

Sujets populaires

IntroducingGateStocks

WinGoldBarsWithGrowthPoints

IsraelStrikesIranBTCPlunges

ArthurHayesSeesHYPEOvertakingSOL

USIranNegotiationGame

Épinglé