CMU教授がオープンソースのエージェントフレームワークMotusを開発、多モデルの編成でSWE-benchを79%まで達成し、コストを半減

robot
概要作成中

MEニュース 4月15日(UTC+8)、動察Beatingの監測によると、カーネギーメロン大学コンピューター科学部教授のDimitrios Skarlatos(CEO)とZhihao Jia(CTO)が設立したAI基盤インフラ企業Lithos AIは、エージェントサービスフレームワークMotusをApache 2.0ライセンスでオープンソース化しました。チームはCMUとスタンフォードの研究者で構成され、AWS、Google、Meta、NVIDIAの運用インフラ経験を持つメンバーが参加しています。Motusの核心思想:異なるタスクには異なるモデルが適しており、常に最も高価な最先端モデルを使ってすべてのステップを実行するのではなく、システムが運用の軌跡から学習し、異なるサブタスクを最も適したモデルに自動的にルーティングします。現在のエージェント展開は静的で、プロンプトフレームワーク、モデル、コンテキスト戦略は固定されていますが、Motusは各実行からタスク成功率、遅延、コスト信号を抽出し、継続的に最適化します。
Lithos AIの公式サイトのデータによると、SWE-bench VerifiedでのMotusの多モデルオーケストレーションは79%の精度を達成し、Claude Opus 4.6の75.8%、GPT-5.3-Codexの72.6%を上回り、コストは単独のOpusの半分以下です。Terminal-Bench 2.0では、精度はOpusの64%から80.1%に向上し、コストも約半減しています。フレームワークはまた、具体的なワークロードに応じてコンテキストメモリ戦略を調整し、並列実行可能なステップを自動検出して遅延を削減します。Motusはモデル提供者に縛られず、OpenAI Agents SDK、Anthropic SDK、Google ADK、純Pythonで構築されたエージェントをサポートし、Claude Code、Codex、Cursorプラグインを提供します。ローカル展開またはクラウドへのプッシュを一つのコマンドで行えます。早期プレビュー段階では無料で計算資源を提供しています。
(出典:BlockBeats)

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン