L'évaluation indépendante montre que le MiniMax M2.7 rivalise avec les modèles de pointe propriétaires dans les tâches d'agents intelligents de base

robot
Création du résumé en cours

ME News Actualités, le 5 avril (UTC+8), récemment, selon une évaluation indépendante de LangChain, le modèle à poids ouverts MiniMax M2.7 a atteint un niveau comparable à celui des modèles de pointe fermés dans des tâches clés d’agents intelligents telles que la manipulation de fichiers, l’appel d’outils et le respect des instructions. L’article estime que ses avantages résident dans une réduction significative des coûts d’environ 20 fois, avec une augmentation de la vitesse de 2 à 4 fois. Par exemple, pour une sortie quotidienne de 10 millions de jetons, le coût avec Opus 4.6 est d’environ 250 dollars par jour, tandis que MiniMax M2.7 ne coûte qu’environ 12 dollars par jour. Cette avancée est rendue possible grâce à la promotion de benchmarks ouverts tels que SWE-Rebench et Terminal Bench 2.0, ce qui permet aux modèles ouverts d’être une option viable pour le déploiement d’agents en environnement de production, et de coexister avec des modèles fermés. (Source : InFoQ)

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler