Une évaluation indépendante montre que le MiniMax M2.7 rivalise avec les modèles de pointe propriétaires dans les tâches d'agents intelligents de base.

robot
Création du résumé en cours

Nouvelles ME, le 5 avril (UTC+8). Récemment, selon une évaluation indépendante de LangChain, le modèle à poids ouverts MiniMax M2.7 a atteint un niveau comparable aux modèles de pointe propriétaires sur des tâches d’agents principaux telles que les opérations sur fichiers, l’appel d’outils et la conformité aux instructions. Le point de vue exprimé dans l’article estime que son avantage réside dans une réduction de coûts d’environ 20 fois et une augmentation de la vitesse de 2 à 4 fois. À titre d’exemple, avec une production quotidienne de 10 millions de tokens, le coût de l’Opus 4.6 est d’environ 250 dollars par jour, tandis que MiniMax M2.7 ne nécessite qu’environ 12 dollars par jour. Cette avancée est due à la dynamique portée par des bancs ouverts comme SWE-Rebench et Terminal Bench 2.0, faisant des modèles ouverts un choix viable pour déployer des agents dans des environnements de production, et permettant également une utilisation en collaboration avec des modèles propriétaires. (Source : InFoQ)

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler