Une évaluation indépendante montre que le MiniMax M2.7 rivalise avec les modèles de pointe propriétaires dans les tâches d'agents intelligents de base.

robot
Création du résumé en cours

Nouvelles ME, message du 5 avril (UTC+8). Récemment, selon une évaluation indépendante de LangChain, le modèle à poids ouverts MiniMax M2.7 a atteint un niveau comparable à celui des modèles de pointe fermés sur des tâches essentielles d’agents, telles que les opérations sur fichiers, l’utilisation d’outils et le respect des instructions. Le point de vue présenté dans l’article estime que son avantage réside dans une réduction des coûts d’environ 20 fois, et une augmentation de la vitesse de 2 à 4 fois. À titre d’exemple, avec une sortie quotidienne de 10 millions de tokens, le coût avec Opus 4.6 est d’environ 250 dollars par jour, tandis que MiniMax M2.7 ne coûte qu’environ 12 dollars par jour. Cette avancée est due à l’impulsion de benchmarks ouverts comme SWE-Rebench et Terminal Bench 2.0, ce qui fait des modèles ouverts un choix réalisable pour déployer des agents dans un environnement de production, et permet également de les utiliser en collaboration avec des modèles fermés. (Source : InFoQ)

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler