فريق يان ليكون يقترح طريقة تخطيط هرمية، لتعزيز قدرة نموذج العالم JEPA على الاستنتاج في المدى الطويل

robot
إنشاء الملخص قيد التقدم

أخبار ME، 8 أبريل (بتوقيت UTC+8)، مؤخرًا، اقترح فريق يان لوكون طريقة تخطيط هرمية تعتمد على نموذج عالم محتمل متعدد المقاييس الزمنية، بهدف حل التحديين الرئيسيين لنماذج العالم ذاتية التعلم في التحكم عبر فترات زمنية طويلة، وهما تراكم أخطاء التنبؤ وزيادة مساحة البحث بشكل أسي. من خلال تعلم نماذج عالم محتمل على مقاييس زمنية مختلفة وتنفيذ تخطيط هرمية عبر المقاييس، حققت الطريقة استنتاج عبر فترات زمنية طويلة، مع تقليل كبير في تعقيد التخطيط أثناء الاستنتاج. يمكن أن يكون هذا الإطار بمثابة وحدة تجريدية قابلة للإضافة، مناسبة لمجموعة متنوعة من هياكل نماذج العالم المحتمل والمجالات. أظهرت التجارب أنه في مهام الروبوتات غير الجشعة في العالم الحقيقي (مثل التقاط وإفلات الأشياء)، عند إعطاء الهدف النهائي فقط، حقق التخطيط الهرمي معدل نجاح بنسبة 70%، بينما كانت نسبة نجاح نموذج العالم الأحادي الطبقة 0%. في بيئات المحاكاة القائمة على الفيزياء (مثل عمليات الدفع والتنقل في المتاهة)، أدى التخطيط الهرمي إلى زيادة معدل النجاح وتقليل وقت التخطيط المطلوب حتى 3 مرات. لا تعتمد هذه الطريقة على مكافآت مهمة محددة أو أهداف فرعية مقدمة من الخارج، مما يظهر قدرة قوية على التعميم في بيئات ومهام غير مرئية. (المصدر: InFoQ)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت