Une évaluation indépendante montre que le MiniMax M2.7 rivalise avec les modèles de pointe propriétaires dans les tâches d'agents intelligents de base.

robot
Création du résumé en cours

Nouvelles ME, le 5 avril (UTC+8) : récemment, selon une évaluation indépendante de LangChain, le modèle à poids ouverts MiniMax M2.7 a atteint un niveau comparable à celui des modèles de pointe propriétaires sur des tâches clés d’agents tels que les opérations sur fichiers, l’appel d’outils et le respect des instructions. L’article estime que son avantage réside dans une réduction des coûts d’environ 20 fois, et une amélioration de la vitesse de 2 à 4 fois. À titre d’exemple, pour une production quotidienne de 10 millions de jetons, le coût avec Opus 4.6 est d’environ 250 dollars par jour, tandis que MiniMax M2.7 ne nécessite qu’environ 12 dollars par jour. Cette avancée est due à la promotion de bancs d’essai ouverts tels que SWE-Rebench et Terminal Bench 2.0, ce qui fait des modèles ouverts un choix viable pour déployer des agents en environnement de production, tout en permettant une utilisation conjointe avec des modèles propriétaires. (Source : InFoQ)

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler