Une évaluation indépendante montre que le MiniMax M2.7 rivalise avec les modèles de pointe propriétaires dans les tâches d'agents intelligents de base.

robot
Création du résumé en cours

ME News, message du 5 avril (UTC+8). Récemment, d’après une évaluation indépendante de LangChain, le modèle à poids ouverts MiniMax M2.7 a atteint un niveau comparable à celui des modèles de pointe fermés sur des tâches d’agents centraux telles que les opérations sur fichiers, l’appel d’outils et l’obéissance aux instructions. L’article estime que son avantage réside dans une réduction considérable des coûts, d’environ 20 fois, ainsi que dans une accélération de 2 à 4 fois. À titre d’exemple, en prenant une production quotidienne de 10 millions de tokens, le coût d’utilisation d’Opus 4.6 est d’environ 250 $/jour, tandis que MiniMax M2.7 ne nécessite qu’environ 12 $/jour. Cette avancée est attribuée à la promotion de benchmarks ouverts tels que SWE-Rebench et Terminal Bench 2.0, ce qui fait des modèles ouverts un choix viable pour déployer des agents en environnement de production, tout en permettant une utilisation en collaboration avec des modèles fermés. (Source : InFoQ)

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler