أستاذ في جامعة كارنيجي ميلون يطلق إطار عمل الوكيل مفتوح المصدر "Motus"، وتنسيق نماذج متعددة لـ SWE-bench وصل إلى 79٪ مع تقليل التكاليف إلى النصف

robot
إنشاء الملخص قيد التقدم

أخبار ME، في 15 أبريل (بتوقيت UTC+8)، وفقًا لمراقبة Beating، قام أستاذ علوم الحاسوب في جامعة كارنيجي ميلون، ديميتريوس سكارتالوس (الرئيس التنفيذي)، و جيه تشيهاو (الرئيس التقني) بتأسيس شركة البنية التحتية للذكاء الاصطناعي Lithos AI وفتح إطار خدمة الوكيل Motus بموجب ترخيص Apache 2.0. يتكون الفريق من باحثين من CMU وستانفورد، مع خبرة في البنية التحتية الإنتاجية من AWS، جوجل، Meta ونفيديا. الفكرة الأساسية لـ Motus: المهام المختلفة تناسب نماذج مختلفة، وبدلاً من استخدام أغلى النماذج المتطورة في جميع الخطوات، يتعلم النظام من مسارات التشغيل الإنتاجية، ويوجه تلقائيًا المهام الفرعية إلى النموذج الأنسب. حاليًا، يكون نشر الوكيل ثابتًا، حيث تظل أطر التلميح، والنماذج، واستراتيجيات السياق ثابتة، بينما يستخلص Motus إشارات نجاح المهمة، والتأخير، والتكلفة من كل عملية تشغيل، ويعمل على تحسينها باستمرار. وفقًا لبيانات موقع Lithos AI، على منصة SWE-bench Verified، حقق تنسيق نماذج متعددة بواسطة Motus دقة بنسبة 79%، متفوقًا على Claude Opus 4.6 الذي بلغت دقته 75.8% وGPT-5.3-Codex الذي بلغت دقته 72.6%، وتكلفته أقل من نصف تكلفة استخدام Opus وحده. على منصة Terminal-Bench 2.0، زادت الدقة من 64% مع Opus إلى 80.1%، وتقلصت التكاليف أيضًا تقريبًا إلى النصف. كما يقوم الإطار بضبط استراتيجية ذاكرة السياق وفقًا لحمولة العمل المحددة، ويكتشف تلقائيًا الخطوات التي يمكن تنفيذها بشكل متوازي لتقليل التأخير. لا يرتبط Motus بمزود النموذج، ويدعم SDK لوكلاء OpenAI، وSDK من شركة Anthropic، وGoogle ADK، ووكيل مبني بالكامل باستخدام بايثون، ويقدم إضافات Claude Code، وCodex، وCursor، مع إمكانية النشر المحلي أو الدفع إلى السحابة عبر أمر واحد. تتوفر القدرة الحاسوبية مجانًا خلال مرحلة المعاينة المبكرة. (المصدر: BlockBeats)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت