Profesor CMU merilis kerangka kerja Agen Motus sumber terbuka, pengaturan banyak model SWE-bench mencapai 79% dan biaya berkurang setengahnya

robot
Pembuatan abstrak sedang berlangsung

Berita ME News, 15 April (UTC+8), menurut pemantauan Beating dari Dongcha, perusahaan infrastruktur AI Lithos AI yang didirikan oleh Profesor Dimitrios Skarlatos (CEO) dan Zhihao Jia (CTO) dari Departemen Ilmu Komputer Carnegie Mellon University merilis open source kerangka layanan Agen Motus, dengan lisensi Apache 2.0. Tim ini terdiri dari peneliti dari CMU dan Stanford, dengan pengalaman infrastruktur produksi dari AWS, Google, Meta, dan Nvidia.
Inti dari pemikiran Motus: tugas yang berbeda cocok dengan model yang berbeda, daripada selalu menjalankan semua langkah dengan model terbaru yang paling mahal, sistem belajar dari jejak operasional produksi dan secara otomatis mengarahkan sub-tugas yang berbeda ke model yang paling sesuai.
Saat ini, setelah agen diterapkan, bersifat statis, dengan kerangka prompt, model, dan strategi konteks yang tetap, sementara Motus mengekstrak sinyal keberhasilan tugas, latensi, dan biaya dari setiap operasi untuk terus mengoptimalkan.
Menurut data dari situs resmi Lithos AI, di SWE-bench Verified, orkestrasi multi-model Motus mencapai tingkat akurasi 79%, lebih tinggi dari Claude Opus 4.6 yang 75,8% dan GPT-5.3-Codex yang 72,6%, dengan biaya kurang dari separuh dari penggunaan Opus saja.
Di Terminal-Bench 2.0, tingkat akurasi meningkat dari 64% milik Opus menjadi 80,1%, dan biaya juga berkurang sekitar setengah.
Kerangka ini juga akan menyesuaikan strategi memori konteks berdasarkan beban kerja tertentu dan secara otomatis mendeteksi langkah-langkah yang dapat dieksekusi secara paralel untuk mengurangi latensi.
Motus tidak terikat pada penyedia model, mendukung SDK Agen OpenAI, SDK Anthropic, SDK Google, dan agen yang dibangun dengan Python murni, menyediakan plugin Claude Code, Codex, dan Cursor, dapat di-deploy secara lokal dengan satu perintah atau didorong ke cloud.
Tahap pratinjau awal menyediakan komputasi secara gratis.
(Sumber: BlockBeats)

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan