Lithos AI a open source le cadre d'agent Motus (Apache 2.0), dont le cœur est de router dynamiquement vers le modèle le plus approprié pour différentes sous-tâches, plutôt que d'utiliser toujours le modèle de pointe le plus coûteux. Motus extrait à chaque exécution des signaux tels que le taux de réussite, la latence et le coût, et optimise en continu le routage, la mémoire contextuelle et l'exécution parallèle. Lors des tests Verified sur SWE-bench, l'orchestration multi-modèles de Motus a atteint un taux de précision de 79 %, avec un coût inférieur à la moitié de celui d'Opus ; le Terminal-Bench 2.0 a amélioré la précision à 80,1 %, avec un coût également environ moitié moindre. Le cadre n'est lié à aucun fournisseur, supporte les SDK d'OpenAI, Anthropic, Google, etc., peut utiliser des plugins comme Claude Code, Codex, Cursor, et déployer localement ou en cloud avec une seule commande, bénéficiant d'une puissance de calcul gratuite en phase initiale.

MeNews

2026-05-08 15:07:48

Création du résumé en cours

ME News Actualités, le 15 avril (UTC+8), selon la surveillance de Beating, le professeur Dimitrios Skarlatos (CEO) et Zhihao Jia (CTO) du département d’informatique de l’Université Carnegie Mellon, fondateurs de la société d’infrastructure AI Lithos AI, ont open source le cadre de service Agent Motus, sous licence Apache 2.0. L’équipe est composée de chercheurs de CMU et de Stanford, avec une expérience en infrastructure de production chez AWS, Google, Meta et Nvidia. La philosophie centrale de Motus : différentes tâches conviennent à différents modèles, et plutôt que d’utiliser toujours le modèle de pointe le plus coûteux pour toutes les étapes, le système apprend des trajectoires de production pour router automatiquement les sous-tâches vers le modèle le plus approprié. Actuellement, le déploiement de l’Agent est statique, avec un cadre de prompts, des modèles et une stratégie de contexte fixes, tandis que Motus extrait des signaux de taux de réussite, de latence et de coût à chaque exécution pour une optimisation continue. Selon les données du site officiel de Lithos AI, sur SWE-bench Verified, l’orchestration multi-modèles de Motus atteint une précision de 79 %, supérieure à Claude Opus 4.6 avec 75,8 % et GPT-5.3-Codex avec 72,6 %, avec un coût inférieur à la moitié de celui de Opus seul. Sur Terminal-Bench 2.0, la précision est passée de 64 % avec Opus à 80,1 %, avec un coût également réduit d’environ moitié. Le cadre ajuste également la stratégie de mémoire contextuelle en fonction de la charge de travail spécifique et détecte automatiquement les étapes pouvant être exécutées en parallèle pour réduire la latence. Motus n’est pas lié à un fournisseur de modèles, supporte le SDK OpenAI Agents, le SDK Anthropic, le SDK Google et des Agents construits en Python pur, offrant des plugins Claude Code, Codex et Cursor, avec une déploiement local par une seule commande ou une poussée vers le cloud. La phase de prévisualisation précoce offre gratuitement la puissance de calcul. (Source : BlockBeats)

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

Récompense
J'aime
Commentaire
Reposter
Partager

Commentaire

Ajouter un commentaire

Aucun commentaire

Sujets populaires
Afficher plus
#
GateSquareMayTradingShare
922.96K Popularité
#
BTCBackAbove80K
59.42M Popularité
#
IsraelStrikesIranBTCPlunges
45.12K Popularité
#
JapanTokenizesGovernmentBonds
1.89M Popularité
#
#DailyPolymarketHotspot
868.73K Popularité

Épingler

Le professeur de CMU ouvre le cadre d'agent open source Motus, l'orchestration multi-modèles SWE-bench atteint 79 % et les coûts sont réduits de moitié

Sujets populaires

GateSquareMayTradingShare

BTCBackAbove80K

IsraelStrikesIranBTCPlunges

JapanTokenizesGovernmentBonds

#DailyPolymarketHotspot

Épingler