أستاذ في جامعة كارنيجي ميلون يطلق إطار عمل الوكيل مفتوح المصدر "Motus"، وتنسيق نماذج متعددة لـ SWE-bench وصل إلى 79٪ مع تقليل التكاليف إلى النصف

robot
إنشاء الملخص قيد التقدم

أخبار ME، في 15 أبريل (بتوقيت UTC+8)، وفقًا لمراقبة Beating، قام أستاذ علوم الحاسوب في جامعة كارنيجي ميلون، ديميتريوس سكارلاتوس (الرئيس التنفيذي)، و جيه تشيهاو (المدير التقني) بتأسيس شركة البنية التحتية للذكاء الاصطناعي Lithos AI وفتح إطار خدمة الوكيل Motus بموجب ترخيص Apache 2.0. يتكون الفريق من باحثين من CMU وستانفورد، مع خبرة في البنية التحتية الإنتاجية من AWS، جوجل، Meta ونفيديا. الفكرة الأساسية لـ Motus: الأنشطة المختلفة تناسب نماذج مختلفة، وبدلاً من استخدام أغلى النماذج المتطورة في جميع الخطوات، يتعلم النظام من مسارات التشغيل الإنتاجية، ويوجه تلقائيًا المهام الفرعية المختلفة إلى النماذج الأنسب. حاليًا، يكون نشر الوكيل ثابتًا، حيث تكون أطر التلميح، النماذج واستراتيجيات السياق ثابتة، بينما يستخلص Motus إشارات نجاح المهام، التأخير والتكلفة من كل عملية تشغيل، ويستمر في التحسين. وفقًا لبيانات موقع Lithos AI، على منصة SWE-bench Verified، حقق تنسيق النماذج المتعددة في Motus دقة بنسبة 79%، متفوقًا على Claude Opus 4.6 الذي بلغت دقته 75.8% و GPT-5.3-Codex الذي بلغت دقته 72.6%، وتكلفته أقل من نصف تكلفة استخدام Opus وحده. على منصة Terminal-Bench 2.0، ارتفعت الدقة من 64% مع Opus إلى 80.1%، وتقلصت التكاليف أيضًا تقريبًا إلى النصف. كما يقوم الإطار بضبط استراتيجية ذاكرة السياق وفقًا لحمولة العمل المحددة، ويكتشف تلقائيًا الخطوات التي يمكن تنفيذها بشكل متوازي لتقليل التأخير. لا يرتبط Motus بمزود نماذج معين، ويدعم SDK لوكلاء OpenAI، وSDK من Anthropic، وSDK من Google، ووكيل مبني بالكامل باستخدام بايثون، ويقدم إضافات Claude Code، Codex و Cursor، مع إمكانية النشر المحلي أو الدفع إلى السحابة عبر أمر واحد. تتوفر القدرة الحاسوبية مجانًا خلال مرحلة المعاينة المبكرة. (المصدر: BlockBeats)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت