CMU教授がオープンソースのエージェントフレームワークMotusを開発、多モデルの編成SWE-benchが79%に達し、コストも半減

robot
概要作成中

MEニュース 4月15日(UTC+8)、動察Beatingの監測によると、カーネギーメロン大学コンピューター科学科の教授Dimitrios Skarlatos(CEO)とZhihao Jia(CTO)が設立したAIインフラ企業Lithos AIは、エージェントサービスフレームワークMotusをApache 2.0ライセンスでオープンソース化した。チームはCMUとスタンフォードの研究者で構成され、AWS、Google、Meta、NVIDIAの運用インフラ経験を持つ。Motusの核心思想:異なるタスクには異なるモデルが適しており、常に最も高価な最先端モデルを使ってすべてのステップを実行するのではなく、システムが運用の軌跡から学習し、異なるサブタスクを最適なモデルに自動的にルーティングする。現在のエージェント展開は静的で、プロンプトフレームワーク、モデル、コンテキスト戦略は固定されているが、Motusは各実行からタスク成功率、遅延、コスト信号を抽出し、継続的に最適化する。
Lithos AIの公式サイトのデータによると、SWE-bench VerifiedでのMotusの多モデルオーケストレーションは79%の精度を達成し、Claude Opus 4.6の75.8%、GPT-5.3-Codexの72.6%を上回り、コストは単独のOpusの半分以下である。Terminal-Bench 2.0では、精度はOpusの64%から80.1%に向上し、コストもほぼ半減した。フレームワークはまた、具体的なワークロードに応じてコンテキストメモリ戦略を調整し、並列実行可能なステップを自動検出して遅延を削減する。Motusはモデル提供者に依存せず、OpenAI Agents SDK、Anthropic SDK、Google ADK、純粋なPythonで構築されたエージェントをサポートし、Claude Code、Codex、Cursorプラグインを提供、一つのコマンドでローカル展開またはクラウドにプッシュ可能。早期プレビュー段階では無料で計算資源を提供している。
(出典:BlockBeats)

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン