عصر «الركيزة الثلاثية» لبيانات الروبوتات قد حل، والتجزئة أصبحت من الماضي

robot
إنشاء الملخص قيد التقدم

انتهى العصر الطائش لمرحلة النمو في تعلم الروبوتات.

لقد ولت أيام تكديس مجموعات البيانات بشكل عشوائي ومستقل. بحلول منتصف عام 2025، أصبح نظام بيئة الروبوتات المفتوحة واضحًا في «ثلاثة أقدام على السُّلطان» — حيث تشكل أنظمة Open X-Embodiment (OXE)، LeRobot و InternData-A1 معالم قياسية حقيقية لنماذج الروبوت الأساسية، حيث فقدت معظم مجموعات البيانات الفردية قبل عام 2023 قدرتها التنافسية.

من التشتت إلى الوحدة: ليس صدفة

يمكن ملاحظة تطور مجموعات بيانات الروبوت على منصة Hugging Face Hub، حيث يمر القطاع حاليًا بتحول من مجموعات مجزأة موجهة للمؤسسات إلى نمط موحد كبير الحجم، قياسي، يقوده المجتمع.

هذا التحول ليس صدفة، وليس نتيجة دفع قسري من أحد. بشكل أساسي، يتطلب تدريب استراتيجيات روبوتات عامة حجمًا قياسيًا ومعايير موحدة؛ ومن ناحية النظام البيئي، فإن المشاريع المدعومة جيدًا والمتوافقة مع الأطر السائدة تجذب المطورين بشكل طبيعي.

ثلاثة أنظمة بيئية تظهر قدراتها

OXE: لحظة ImageNet في مجال الروبوتات

Open X-Embodiment هو اتحاد أطلقته 34 مختبر روبوتات رائد في نهاية عام 2023. هو ليس مجموعة بيانات واحدة، بل دمج كبير لأكثر من 60 مجموعة بيانات موجودة تحت بنية موحدة.

الأرقام تتحدث:

  • أكثر من مليون مسار حقيقي من العالم الواقعي
  • تغطية 22 نوعًا مختلفًا من أشكال الروبوت (من ذراع صناعي إلى روبوت رباعي الأرجل، وذراع متحرك)
  • جميع البيانات محولة إلى تنسيق RLDS المبني على TensorFlow و Apache Arrow

الدرس الرئيسي واضح — العمليات البسيطة أصبحت سلعة. المهام الأساسية مثل الالتقاط، والإفلات، وفتح الأدراج، والتجميع باستخدام ذراع واحد، قد «تم حلها» على مستوى البيانات. هذا يعني أن عصر جني الأرباح من بيع بيانات التحكم عن بعد الأساسية قد انتهى تمامًا. المستقبل التجاري يكمن في بيانات خبراء عالية الدقة، أو العمليات طويلة المدى في بيئات منزلية حقيقية، أو تلك البيانات النادرة ذات الأشكال المادية (كالإنسانية، والبرمجية).

LeRobot: الإجابة القياسية في معسكر PyTorch

على عكس مسار أبحاث Google/TensorFlow الذي تمثله OXE، سرعان ما أصبح LeRobot من Hugging Face المعيار الحقيقي للمجتمع المفتوح — خاصة لمحبي PyTorch.

السلاح السري لهذا النظام هو التكديس الكامل: مجموعة البيانات + النموذج + كود التدريب + أدوات التقييم.

أما الابتكار في التخزين فهو جدير بالذكر: إصدار Dataset v3.0 من LeRobot يستخدم Apache Parquet + MP4/AV1 مضغوط، مما زاد من كفاءة التخزين بمقدار 5-10 مرات، وسرعة التحميل تحسنت بشكل ملحوظ.

المجموعات البيانات الرائدة تشمل:

  • DROID 1.0.1: من أكثر من 50 فريقًا، حوالي 76,000 مجموعة بيانات، تم جمعها عمدًا في «بيئات خارجية»، لضمان انعكاس أكبر قدر من التغيرات الواقعية
  • سلسلة Aloha: بيانات عالية الدقة لذراعين مزدوجين وذراعين متحركين

الدرس الواقعي: معايير تسليم البيانات أصبحت دائمًا Parquet + MP4. أي مزود خدمة تجارية لا يزال يستخدم حزم ROS أو فيديوهات خام، فهو يضيف عبئًا تقنيًا غير ضروري للعملاء.

البيانات التركيبية «الانتصار المعاكس»: InternData-A1

القوة الثالثة تأتي من البيانات التركيبية عالية الدقة على نطاق واسع. يمثل InternData-A1 من مختبر الذكاء الاصطناعي في شنغهاي أحدث تقدم في هذا الاتجاه:

  • الحجم: 630,000 مسار، يعادل 7,433 ساعة من عمل الروبوتات
  • التنوع الفيزيائي: ليس فقط الأجسام الصلبة، بل يشمل أيضًا الأجسام المفصلية، السوائل، الجسيمات، والمواد القابلة للتشوه (كالملابس، الحبال)
  • التقنية: محرك فيزياء متقدم + عشوائية المجال + تصيير بصري واقعي + توليد دورات تلقائي

الفجوة الواقعية: سقف البيانات التركيبية

لكن هناك نقطة تحول مهمة — على الرغم من تقدم البيانات التركيبية، فهي ليست كاملة.

وجد استطلاع شامل في أكتوبر 2025 أن التقدم الهندسي ملحوظ، لكن الفجوة الأساسية بين المحاكاة والواقع لم تُقضَ عليها، بل تم تضييقها إلى مجالات أضيق لكنها لا تزال حاسمة.

وتشمل التحديات الرئيسية:

فجوة الديناميكيات: حتى أفضل محركات الفيزياء في 2025 تظل غير قادرة على التعامل مع الظواهر الفوضوية، والأجسام القابلة للتشوه، والأجسام الرقيقة (مثل أنماط انحناء الأقمشة، والطيّات والذكريات)، بالإضافة إلى تراكم أخطاء التكامل العددي. استراتيجيات تعمل بشكل جيد في المحاكاة قد تنهار عند التفاعل مع ملامسة كثيفة في الواقع.

فجوة الإدراك والحساسات: رغم أن التصيير التركبي وصل إلى مستوى واقعي للصور، إلا أنه لا يخلو من عيوب منهجية — نماذج عيوب الكاميرا الحقيقية غير دقيقة، نقص في التشتت السطحي، تأثير الهالة، والغبار.

فجوة التحكم والتنفيذ: الروبوتات الحقيقية لديها متحكمات مخفية تتغير مع الزمن، وتتطلب ضبطًا دقيقًا لكل وحدة.

فجوة النظام البيئي: من الصعب محاكاة أدوات الأمان، وتأخير الاتصال، والتوافق مع الأرضية غير المُنمذج.

تشير البيانات إلى أن النماذج الأساسية الحالية (مثل RT-2-X، Octo وغيرها) عند انتقالها من المحاكاة إلى الروبوتات الحقيقية، تنخفض معدلات النجاح عادةً بين 40-80%، وتؤدي بشكل أسوأ في المهام ذات الأجسام القابلة للتشوه، والتلامس الكثيف، والمهام طويلة المدى.

في الواقع، البيانات الحقيقية لم تُقضَ عليها بعد

على الرغم من التقدم في التعميم عبر العشوائية الميدانية، والنمذجة المتبقية، والتدريب المختلط (90-99% تركيبية + 1-10% حقيقية)، إلا أن الحد الأدنى في 2025 هو أن النقل من المحاكاة بدون لقطات لا يزال محدودًا للمهام الصلبة ذات التعقيد المتوسط والبيئات الخاضعة للسيطرة.

بالنسبة للتطبيقات التي تتطلب التعامل مع الأجسام القابلة للتشوه، والسوائل، والتجميع عالي الدقة، أو العمليات المنزلية غير المنظمة، تظل البيانات الواقعية — خاصة بيانات الأداء الخبير عالية الجودة — ذات قيمة لا يمكن الاستغناء عنها.

ماذا يعني هذا لمزودي البيانات؟ الفرص التجارية بين 2026 و2028 تكمن في الحلول المختلطة التي تجمع بين كميات هائلة من البيانات التركيبية وبيانات المسارات الحقيقية المختارة، خاصة في المجالات «ذات الصعوبة العالية» (كالملابس، والسوائل، والمشاهد المعقدة، والتفكير متعدد الخطوات). البيانات التركيبية وحدها لن تكون كافية في المستقبل القريب لدعم عمليات الإنتاج.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت