قدم فريق يان لوكون نموذج تخطيط هرمي يعتمد على نماذج العالم الكامنة متعددة المقاييس الزمنية، لحل مشكلة تراكم أخطاء التنبؤ وزيادة حجم مساحة البحث بشكل أسي في التحكم على المدى الطويل. من خلال تعلم نماذج كامنة على مقاييس زمنية مختلفة والتخطيط عبر المقاييس، يحقق استنتاج على المدى الطويل ويقلل بشكل كبير من تعقيد الاستنتاج، ويمكن أن يعمل كوحدة تجريدية قابلة للتوصيل لتكييف مع العديد من الهياكل. في التجارب على مهمة روبوت غير أنانية حقيقية (القبض والإفلات)، مع إعطاء الهدف النهائي فقط، بلغت نسبة نجاح التخطيط الهرمي 70%، مقابل 0% لنموذج الطبقة الواحدة؛ وفي المحاكاة الفيزيائية (الدفع، المتاهة)، عزز التخطيط الهرمي نسبة النجاح وخفض زمن التخطيط بحوالي 3 أضعاف. لا تعتمد هذه الطريقة على مكافأة المهمة أو الأهداف الفرعية الخارجية، ولها قدرة تعميم قوية. المصدر: InFoQ

MeNews

2026-05-01 07:49:48

إنشاء الملخص قيد التقدم

أخبار ME، 8 أبريل (بتوقيت UTC+8)، مؤخرًا، اقترح فريق يان لوكون طريقة تخطيط هرمية تعتمد على نموذج عالم محتمل متعدد المقاييس الزمنية، بهدف حل التحديين الرئيسيين لنماذج العالم ذاتية التعلم في التحكم عبر فترات زمنية طويلة، وهما تراكم أخطاء التنبؤ وزيادة مساحة البحث بشكل أسي. من خلال تعلم نماذج عالم محتمل على مقاييس زمنية مختلفة وتنفيذ تخطيط هرمية عبر المقاييس، حققت الطريقة استنتاج عبر فترات زمنية طويلة، مع تقليل كبير في تعقيد التخطيط أثناء الاستنتاج. يمكن أن يكون هذا الإطار بمثابة وحدة تجريدية قابلة للإضافة، مناسبة لمجموعة متنوعة من هياكل نماذج العالم المحتمل والمجالات. أظهرت التجارب أنه في مهام الروبوتات غير الجشعة في العالم الحقيقي (مثل التقاط وإفلات الأشياء)، عند إعطاء الهدف النهائي فقط، حقق التخطيط الهرمي معدل نجاح بنسبة 70%، بينما كانت نسبة نجاح نموذج العالم الأحادي الطبقة 0%. في بيئات المحاكاة القائمة على الفيزياء (مثل عمليات الدفع والتنقل في المتاهة)، أدى التخطيط الهرمي إلى زيادة معدل النجاح وتقليل وقت التخطيط المطلوب حتى 3 مرات. لا تعتمد هذه الطريقة على مكافآت مهمة محددة أو أهداف فرعية مقدمة من الخارج، مما يظهر قدرة قوية على التعميم في بيئات ومهام غير مرئية. (المصدر: InFoQ)

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

أعجبني
إعجاب
تعليق
إعادة النشر
مشاركة

تعليق

إضافة تعليق

لا توجد تعليقات

المواضيع الرائجة
عرض المزيد
#
WCTCTradingKingPK
443.39K درجة الشعبية
#
USSeeksStrategicBitcoinReserve
58.69M درجة الشعبية
#
IsraelStrikesIranBTCPlunges
37.24K درجة الشعبية
#
BitcoinETFOptionLimitQuadruples
981.54K درجة الشعبية
#
#FedHoldsRateButDividesDeepen
30.62K درجة الشعبية

تثبيت

خريطة الموقع

فريق يان ليكون يقترح طريقة تخطيط هرمية، لتعزيز قدرة نموذج العالم JEPA على الاستنتاج في المدى الطويل

المواضيع الرائجة

WCTCTradingKingPK

USSeeksStrategicBitcoinReserve

IsraelStrikesIranBTCPlunges

BitcoinETFOptionLimitQuadruples

#FedHoldsRateButDividesDeepen

تثبيت