Le professeur de CMU ouvre le cadre d'agent open source Motus, l'orchestration multi-modèles SWE-bench atteint 79 % et les coûts sont réduits de moitié

robot
Création du résumé en cours

ME News Actualités, le 15 avril (UTC+8), selon la surveillance de Beating, le professeur Dimitrios Skarlatos (CEO) et Zhihao Jia (CTO) du département d’informatique de l’Université Carnegie Mellon, fondateurs de la société d’infrastructure AI Lithos AI, ont open source le cadre de service Agent Motus, sous licence Apache 2.0. L’équipe est composée de chercheurs de CMU et de Stanford, avec une expérience en infrastructure de production chez AWS, Google, Meta et Nvidia. La philosophie centrale de Motus : différentes tâches conviennent à différents modèles, et plutôt que d’utiliser toujours le modèle de pointe le plus coûteux pour toutes les étapes, le système apprend des trajectoires de production pour router automatiquement les sous-tâches vers le modèle le plus approprié. Actuellement, le déploiement de l’Agent est statique, avec un cadre de prompts, des modèles et une stratégie de contexte fixes, tandis que Motus extrait des signaux de taux de réussite, de latence et de coût à chaque exécution pour une optimisation continue. Selon les données du site officiel de Lithos AI, sur SWE-bench Verified, l’orchestration multi-modèles de Motus atteint une précision de 79 %, supérieure à Claude Opus 4.6 avec 75,8 % et GPT-5.3-Codex avec 72,6 %, avec un coût inférieur à la moitié de celui de Opus seul. Sur Terminal-Bench 2.0, la précision est passée de 64 % avec Opus à 80,1 %, avec un coût également réduit d’environ moitié. Le cadre ajuste également la stratégie de mémoire contextuelle en fonction de la charge de travail spécifique et détecte automatiquement les étapes pouvant être exécutées en parallèle pour réduire la latence. Motus n’est pas lié à un fournisseur de modèles, supporte le SDK OpenAI Agents, le SDK Anthropic, le SDK Google et des Agents construits en Python pur, offrant des plugins Claude Code, Codex et Cursor, avec une déploiement local par une seule commande ou une poussée vers le cloud. La phase de prévisualisation précoce offre gratuitement la puissance de calcul. (Source : BlockBeats)

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler