MiniMax a open-sourcé MSA, la inférence de contexte d'environ un million de tokens n'a plus besoin de dépenser des crédits, licence MIT pour une utilisation commerciale directe, cette semaine je reste en attente des poids M3

Voir l'original
CoinNetwork
MiniMax open source bibliothèque d'attention exclusive Blackwell, le poids M3 devrait être publié ce vendredi
CoinWorld报道,MiniMax宣布其面向NVIDIA Blackwell(SM100)的高性能注意力库MSA已开源,MIT许可,MiniMax-M3权重本周发布。
MSA通过筛选KV块,仅对相关块执行注意力,支持百万级上下文推理。
研究显示,在1M token情境下,MSA比Dense GQA大幅降低计算量,并在H800上实现显著加速。
开源版本集成C++ JIT与Cute-DSL,支持多精度。
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé