Lithos AIはMotus代理フレームワーク（Apache 2.0）をオープンソース化しました。コアは、異なるサブタスクを最も適したモデルに動的にルーティングすることであり、常に最も高価な最先端モデルを使用するわけではありません。 Motusは各実行から成功率、遅延、コストなどの信号を抽出し、ルーティング、コンテキストメモリ、並列実行を継続的に最適化します。 SWE-bench Verifiedテストでは、Motusのマルチモデルオーケストレーションの正確率は79％に達し、コストはOpusの半分以下です。 Terminal-Bench 2.0では正確率が80.1％に向上し、コストも約半分です。このフレームワークはベンダーに縛られず、OpenAI、Anthropic、GoogleなどのSDKをサポートし、Claude Code、Codex、Cursorなどのプラグインを利用可能です。 1つのコマンドでローカル展開またはクラウドにプッシュでき、早期は無料の計算能力も提供します。

MeNews

2026-05-08 07:24:33

概要作成中

MEニュース 4月15日（UTC+8）、動察Beatingの監測によると、カーネギーメロン大学コンピューター科学科の教授Dimitrios Skarlatos（CEO）とZhihao Jia（CTO）が設立したAIインフラ企業Lithos AIは、エージェントサービスフレームワークMotusをApache 2.0ライセンスでオープンソース化した。チームはCMUとスタンフォードの研究者で構成され、AWS、Google、Meta、NVIDIAの運用インフラ経験を持つ。Motusの核心思想：異なるタスクには異なるモデルが適しており、常に最も高価な最先端モデルを使ってすべてのステップを実行するのではなく、システムが運用の軌跡から学習し、異なるサブタスクを最適なモデルに自動的にルーティングする。現在のエージェント展開は静的で、プロンプトフレームワーク、モデル、コンテキスト戦略は固定されているが、Motusは各実行からタスク成功率、遅延、コスト信号を抽出し、継続的に最適化する。
Lithos AIの公式サイトのデータによると、SWE-bench VerifiedでのMotusの多モデルオーケストレーションは79%の精度を達成し、Claude Opus 4.6の75.8%、GPT-5.3-Codexの72.6%を上回り、コストは単独のOpusの半分以下である。Terminal-Bench 2.0では、精度はOpusの64%から80.1%に向上し、コストもほぼ半減した。フレームワークはまた、具体的なワークロードに応じてコンテキストメモリ戦略を調整し、並列実行可能なステップを自動検出して遅延を削減する。Motusはモデル提供者に依存せず、OpenAI Agents SDK、Anthropic SDK、Google ADK、純粋なPythonで構築されたエージェントをサポートし、Claude Code、Codex、Cursorプラグインを提供、一つのコマンドでローカル展開またはクラウドにプッシュ可能。早期プレビュー段階では無料で計算資源を提供している。
（出典：BlockBeats）

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。