العقود الآجلة
وصول إلى مئات العقود الدائمة
CFD
الذهب
منصّة واحدة للأصول التقليدية العالمية
الخیارات المتاحة
Hot
تداول خيارات الفانيلا على الطريقة الأوروبية
الحساب الموحد
زيادة كفاءة رأس المال إلى أقصى حد
التداول التجريبي
مقدمة حول تداول العقود الآجلة
استعد لتداول العقود الآجلة
أحداث مستقبلية
"انضم إلى الفعاليات لكسب المكافآت "
التداول التجريبي
استخدم الأموال الافتراضية لتجربة التداول بدون مخاطر
CFD
مشتقات CFD للأسهم الأمريكية
الأسهم الأمريكية
وصول إلى الأسهم الأمريكية وصناديق ETF الحقيقية
أسهم هونغ كونغ
تداول أسهم عالية الجودة مدرجة في هونغ كونغ
الأسهم الكورية
SK Hynix
تداول الأسهم الكورية الحقيقية واستثمر في الأصول الشائعة
العقود الآجلة للأسهم
رافع مالية عالية، وتداول على مدار 24/7
الأسهم المُرمَّزة
مدعومة بأصول أسهم حقيقية
IPO Access
افتح الوصول الكامل إلى الاكتتابات العامة للأسهم العالمية
GUSD
سك GUSD للحصول على عوائد أصول العالم الحقيقي (RWA) للخزانة
أنشطة الأسهم
تداول الأسهم الرائجة واحصل على إنزالات جوية سخية
إطلاق
CandyDrop
اجمع الحلوى لتحصل على توزيعات مجانية.
منصة الإطلاق
-التخزين السريع، واربح رموزًا مميزة جديدة محتملة!
HODLer Airdrop
احتفظ بـ GT واحصل على توزيعات مجانية ضخمة مجانًا
IPO Access
افتح الوصول الكامل إلى الاكتتابات العامة للأسهم العالمية
نقاط Alpha
تداول الأصول على السلسلة واكسب التوزيعات المجانية
نقاط العقود الآجلة
اكسب نقاط العقود الآجلة وطالب بمكافآت التوزيع المجاني
عروض ترويجية
AI
Gate AI
شريكك الذكي الشامل في الذكاء الاصطناعي
Gate AI Bot
استخدم Gate AI مباشرة في تطبيقك الاجتماعي
GateClaw
Gate الأزرق، جاهز للاستخدام
Gate for AI Agent
البنية التحتية للذكاء الاصطناعي، Gate MCP، Skills و CLI
Gate Skills Hub
أكثر من 10 آلاف مهارة
من المكتب إلى التداول، مكتبة المهارات الشاملة تجعل الذكاء الاصطناعي أكثر فعالية
لحظة مهارات الذكاء الجسدي! إنفيديا تفتح مكتبة مهارات الروبوتات، جيم فان: تغير النموذج.
6! الروبوتات يمكنها أيضًا تعلم المهارات.
لقد أطلقت NVIDIA للتو مجموعة مهارات تمكن الروبوتات من النمو المستمر —
ASPIRE.
لفهم الأمر ببساطة، يمكن اعتبار ASPIRE نوعًا ما بمثابة وكيل برمجة للروبوتات، شبيه بالـ Coding Agent.
تمامًا كما يمكن لـ GPT تحويل prompts وسجلات العمل الخاصة بك إلى مهارات قابلة لإعادة الاستخدام، فإنه أيضًا يحول إخفاقات الروبوت وإصلاحاته المتكررة إلى تجارب يمكن استدعاؤها لاحقًا.
الفرق هو أنه لا يراجع الكود، بل يراجع عمليات التشغيل الخاصة بالروبوت.
في كل مرة ينفذ فيها الروبوت مهمة، يسجل ASPIRE عمليات الإدراك، والملاحة، والالتقاط، والاصطدام، وتخطيط الحركة، وغيرها.
ويقوم GPT/Claude الذي يستدعيه في الخلفية، مثل باحث، بتحديد مكان المشكلة في المهمة وتكرار البرنامج. إذا نجح التنفيذ، يتم كتابة الخبرات المتراكمة في Skill.
وهكذا، يمكن للروبوت أن يتعلم باستمرار من خلال كتابة الكود، ومشاهدة مسار التنفيذ، وتعديل البرنامج، وتراكم المهارات.
وهذا ليس مجرد تحويل خبرات الروبوت إلى مهارات بهذه البساطة.
كما صرح مدير قسم الروبوتات في NVIDIA، Jim Fan، بأن ASPIRE تمثل نموذجًا جديدًا تمامًا للتعلم المستمر.
حيث:
ما يُدرَّب، ليس بالضرورة أوزانًا
على الرغم من أن المقدمة قد أوضحت التفاصيل، إلا أنني سأضيف بعض الخلفية قبل شرح كيفية تغيير نموذج تدريب الروبوتات.
الاسم الكامل لـ ASPIRE هو Agentic Skill Programming through Iterative Robot Exploration.
يسمح للروبوت بتنفيذ المهام باستخدام الكود، وعند الفشل، مشاهدة مسار التنفيذ متعدد الوسائط، ثم تعديل البرنامج، وتخزين الخبرات المُصلحة في مكتبة مهارات متزايدة باستمرار.
هذه المهارة (Skill)، على الرغم من أنها في جوهرها لا تزال سياقًا يُغذى للنموذج الكبير، إلا أنها تخزن مجموعة من أنماط إصلاح الكود المُثبتة (Code Repair Pattern)، مما يسمح للروبوت بمعرفة كيفية تعديل برنامج التحكم عند مواجهة مشكلة معينة.
على سبيل المثال، عندما يحاول الروبوت التقاط راديو، وقد تعرف على الهدف بالفعل، لكنه لا يستطيع الاقتراب منه.
يمكن للوكيل تحليل أن السبب ليس خطأ في التعرف، بل أن النقاط المستهدفة التي يعطيها المخطط (Planner) تقع جميعها داخل منطقة الاصطدام بالعائق.
وبالتالي، بناءً على هذه التجربة، سيقوم ASPIRE بتلخيص مهارة جديدة:
في المستقبل، عند مواجهة مواقف مماثلة، سواء كان الهدف راديوًا أو ميكروويف أو أي أثاث آخر، يمكن إعادة استخدام هذه الخبرة مباشرة دون الحاجة لتجربة الأخطاء مرة أخرى.
قد تتساءل الآن: أليس تدريب الروبوتات يجب أن يكون حول البيانات، الانحدار التدرجي، أوزان النموذج، التجميع الحقيقي، نقل المحاكاة إلى الواقع؟
فجأة أصبح كل شيء عن تجميع المهارات؟
هنا يجب أولاً تقديم نموذج شائع مؤخرًا، وهو Code as Policy.
على عكس نماذج السياسة من طرف إلى طرف مثل VLA، لا يجعل Code as Policy النموذج يخرج حركات الروبوت مباشرة، بل يطلب من النموذج الكبير كتابة برنامج تحكم قابل للتنفيذ للروبوت.
يمكن للبرنامج استدعاء وحدات الإدراك، وواجهات برمجة التخطيط، والأوامر البدائية للتحكم، مثل التعرف على الأشياء، تخطيط المسار، تحريك الذراع الميكانيكية، تنفيذ الالتقاط.
بهذه الطريقة، لم يعد سلوك الروبوت مخفيًا بالكامل في أوزان الشبكة العصبية، بل أصبح كودًا قابلًا للتنفيذ.
مع وجود الكود، يمكن لنماذج الوكيل القوية جدًا حاليًا فحصه وتعديله وتصحيحه وتحسينه.
لكن في الماضي، كان لدى Code as Policy مشكلتان.
أولاً، عندما يفشل الروبوت، يعرف النظام عادةً فقط أن "المهمة لم تكتمل"، لكنه لا يعرف ما إذا كان السبب هو خطأ في الإدراك، أو عدم ثبات الالتقاط، أو اصطدام في تخطيط المسار، أو مشكلة في حركة الاستعادة.
ثانيًا، والأهم، لا يتذكر.
بعد إكمال مهمة، يتم التخلص من حلول الإصلاح واستراتيجيات الاستعادة وطريقة كتابة prompts التي تم اكتشافها أثناء التصحيح، وعند مواجهة مشكلة مماثلة في المرة القادمة، يجب البدء من جديد.
لهذا قال Jim Fan:
ببساطة، هذه العملية تشبه تمامًا مهندس الروبوتات البشري:
عند فشل برنامج روبوت، يراجع المهندس عملية التنفيذ، وينظر إلى نتائج الإدراك، ويحلل مسار الحركة، ويقرر ما إذا كان الخطأ في الالتقاط، التخطيط، أو أن حركة استعادة معينة لم تنجح.
بعد الإصلاح، يسجل المهندس هذه الخبرة. في المرة القادمة التي يواجه فيها جسمًا على حافة الطاولة، مقبض درج، أو ملاحة في مساحة ضيقة، لن يبدأ من الصفر.
وما يفعله ASPIRE هو نقل آلية تراكم الخبرات هذه إلى الوكيل. لا يقتصر الأمر على جعل النموذج الكبير يكتب كود الروبوت، بل يجعله يجرب مرارًا، ويراجع مرارًا، ويصلح مرارًا داخل بيئة التنفيذ، وأخيرًا يخزن خبرات الإصلاح المثبتة كمهارات.
لذا، في ASPIRE، لم يعد التدريب مجرد انحدار تدرجي.
أصبحت عملية التدريب هي صقل المهارات؛ وناتج التدريب ليس مجرد أوزان النموذج، بل مكتبة مهارات يبنيها الروبوت وينميها باستمرار.
خط أنابيب ثلاثي المراحل
في الورقة البحثية، تم تنفيذ هذه الفكرة كخط أنابيب من ثلاث مراحل.
أولاً، محرك تنفيذ الروبوت (robot execution engine).
في برامج الروبوت التقليدية، عند الفشل، قد يخبرك النظام فقط أن المهمة لم تكتمل.
يقوم ASPIRE بتفصيل الفشل، وفي كل مرة يحدث فيها إدراك، تخطيط، التقاط، استدعاء تحكم، يتم تسجيل المدخلات، المخرجات، الأدلة البصرية، وسجلات الأخطاء.
مثلما يراجع مهندسو الروبوتات البشرية الفيديو وينظرون إلى المسارات ويتحققون ما إذا كان الخطأ في الإدراك أم الالتقاط، يقوم ASPIRE بنقل هذه العملية إلى وكيل برمجة.
ثانيًا، مكتبة المهارات (skill library). بعد أن يقوم الوكيل بإصلاح البرنامج، لا يتخلص من هذه الخبرة، بل يحولها إلى معرفة قابلة لإعادة الاستخدام.
في مكتبة المهارات على الموقع، يمكن رؤية عناصر محددة جدًا، مثل كيفية كتابة نص SAM3، كيفية الاقتراب من الأجسام على حافة الطاولة من زوايا متعددة، كيفية تصفية الكشف الزائف لمقابض الأدراج، وأي نوع من الحركات البدائية يجب استخدامه عند دفع الأجسام المسطحة.
هذه المهارات ليست مثل أوزان النماذج التقليدية، بل تشبه ملاحظات الأخطاء التي يدونها مبرمجو الروبوتات.
أخيرًا، البحث التطوري (evolutionary search).
وكيل واحد لا يكتفي بمحاولة مسار إصلاح واحد، بل يقوم النظام بإنشاء عدة برامج تحكم مرشحة، ويجعلها تعمل في بيئة التنفيذ، ثم يستمر في التكرار بناءً على البرامج الناجحة ومسارات الفشل.
في هندسة البرمجيات، اعتاد وكلاء البرمجة على كتابة الكود، تشغيل الاختبارات، مراجعة التتبعات، وتصحيح الأخطاء. ما يفعله ASPIRE هو نقل هذه الحلقة إلى العالم المادي.
التحقق التجريبي
للتحقق من صحة هذه الطريقة، تم اختبار الورقة على ثلاثة معايير كلاسيكية للروبوتات، بما في ذلك LIBERO-Pro وRobosuite وBEHAVIOR-1K، والتي تغطي العمليات العامة، والعمليات التي تتطلب تلامسًا كثيفًا، والمهام المنزلية الطويلة.
كانت النتائج الإجمالية أفضل بشكل ملحوظ من طرق Code as Policy السابقة.
على سبيل المثال، في مهمة تسليم الجسم بين ذراعين (Bimanual Handover) في Robosuite، رفع ASPIRE نسبة النجاح من 20% إلى 92%.
أما بالنسبة لقابلية التعميم.
أولاً، تم تجميع مكتبة المهارات على LIBERO-90، ثم تم نقلها مباشرة إلى مهام LIBERO-Pro الطويلة التي لم يسبق رؤيتها، دون تدريب إضافي على المهام الجديدة أو تحديث مكتبة المهارات.
أظهرت النتائج أنه مع زيادة تنوع مكتبة المهارات، ارتفع معدل نجاح الروبوت في المهام الجديدة، من عدم القدرة تقريبًا إلى الوصول إلى 31%. بمعنى آخر، كلما زادت ثراء مكتبة المهارات، قل تشبه الروبوت بمبتدئ.
مقدمة عن المؤلفين
في نهاية المدونة التقنية، كشفت NVIDIA عن قائمة المؤلفين الكاملة.
لا تزال الوجوه المألوفة من فريق GEAR: Jim Fan، Zhu Yuke، Guanzhi Wang، Shi Guanya، وغيرهم.
المؤلفون الثلاثة الأوائل هم المساهمون المشتركون.
حيث أن Runyu Lu حاليًا طالب دكتوراه في السنة الثانية بجامعة ميشيغان، ويتدرب في GEAR؛ Yuubo Wu من جامعة إلينوي في أوربانا-شامبين (UIUC)، وEthan Kou من جامعة كاليفورنيا، بيركلي، وهو لا يزال طالبًا جامعيًا.
يُذكر أنه بالأمس فقط، أعلنت NVIDIA أيضًا عن توسيع توظيف فريق الروبوتات المحلي في الصين، وفتحت العديد من المناصب في بكين وشنغهاي وشنتشن، تغطي مجالات مثل الحضور الذكي، المحاكاة، نشر الروبوتات، وهندسة الحلول.
المصدر: Quantum Bit
إخلاء المسؤولية ومخاطر الاستثمار