علي بابا قدمت نماذج ذكاء اصطناعي لإدارة الروبوتات - ForkLog

Tool_AI# ألبابا قدمت نماذج ذكاء اصطناعي لإدارة الروبوتات

قدمت شركة علي بابا مجموعة Qwen-Robot Suite — مجموعة نماذج ذكاء اصطناعي للروبوتات والمهام في البيئة الفيزيائية: Qwen-RobotNav للملاحة، Qwen-RobotManip للتعامل مع الأجسام وQwen-RobotWorld لتوقع تطور المشهد. وصفت الفريق المشروع بأنه «طيف كامل للذكاء الاصطناعي المجسد».

📣 تقديم مجموعة Qwen-Robot — Qwen-RobotNav، Qwen-RobotManip، Qwen-RobotWorld، ثلاثة نماذج أساسية، طيف كامل للذكاء المجسد.

🧭 Qwen-RobotNav — بوابة التنقل.
• يوحد 5 مهام تنقل في نموذج واحد: اتباع التعليمات، الوصول إلى نقطة،… pic.twitter.com/noumjTtTeS

— Qwen (@Alibaba_Qwen) 16 يونيو 2026

يتعلق الأمر بنماذج برمجية تهدف لمساعدة الوكلاء الفيزيائيين على إدراك البيئة المحيطة، وتخطيط الإجراءات، وتنفيذ الأوامر باللغة الطبيعية. تجري مجموعة Qwen-Robot Suite حالياً تجارب أولية مع عملاء مؤسسيين من Alibaba Cloud في مجال الروبوتات.

لماذا تطرح Alibaba Qwen في العالم الفيزيائي

نماذج اللغة الكبيرة والنماذج متعددة الوسائط أصبحت قادرة على العمل مع النصوص، والصور، والفيديو، والكلام، لكن ذلك غير كافٍ للروبوتات. يحتاج الوكلاء الفيزيائيون إلى فهم الأوامر، وتحويلها إلى حركة، ومراعاة الفضاء، وخصائص الأجسام، وقيود الحساسات، ونتائج الأفعال.

تطلق Alibaba على هذا الاتجاه اسم الذكاء الاصطناعي الفيزيائي، أو «الذكاء الاصطناعي المجسد». في هذا النهج، يجب أن تعمل النموذج ليس فقط مع البيانات الرقمية، بل مع البيئة الفيزيائية: التحرك، العثور على الأجسام، إدارة الأدوات، وتوقع ما سيحدث بعد التنفيذ.

Qwen-RobotNav: خمس مهام تنقل في نموذج واحد

Qwen-RobotNav مسؤولة عن التنقل. يجمع النموذج خمس مجموعات من المهام:

  • اتباع التعليمات؛
  • الوصول إلى نقطة محددة؛
  • البحث عن الأجسام؛
  • تتبع الهدف؛
  • القيادة الذاتية.

وفقاً لمعلومات Alibaba، تم بناء Qwen-RobotNav على أساس Qwen3-VL وتدريبها على 15.6 مليون عينة مرتبطة بتخطيط المسارات والتفكير البصري-اللغوي.

أعلنت الشركة أن نسبة النجاح بلغت 76.5% في VLN-CE RxR و90% في EVT-Bench. وأوضحت Alibaba أن النموذج يمكن أن يعمل كأداة لنظم الوكيل الأكبر: النموذج العلوي يخطط المهمة، وQwen-RobotNav مسؤول عن التنقل.

المصدر: Qwen. في عروض Alibaba، توضح سيناريوهات مثل البحث عن غرض مفقود في غرفة أو التحقق مما إذا كان عنصر معين مفتوحاً في مبنى. في مثل هذه المهام، يجب على الروبوت ألا يتحرك فقط، بل يجمع أدلة بصرية ويعيد الرد على المستخدم.

Qwen-RobotManip: التعامل مع الأجسام

Qwen-RobotManip مخصص للأفعال الفيزيائية مع الأجسام. يجب أن يساعد النموذج الروبوتات على التقاط، ونقل، ووضع الأغراض، بالإضافة إلى نقل المهارات بين أنواع مختلفة من الأجهزة.

المصدر: Qwen-RobotManip. أحد التحديات الرئيسية في الروبوتات هو أن الروبوتات تصف الأفعال بشكل مختلف. ذراع manipulators، منصة ذات يدين، روبوت بمقبض، أو نظام متنقل يستخدم إحداثيات، مفاصل، وصيغ أوامر مختلفة. تحاول Qwen-RobotManip توحيد هذه البيانات لتمكين التعلم من نوع واحد من الروبوتات لمساعدة أخرى.

استخدمت Alibaba أكثر من 38,100 ساعة من البيانات للتدريب. شمل هذا 11,320 ساعة من البيانات المفتوحة للروبوتات، و1933 ساعة من فيديوهات أفعال الإنسان من وجهة نظر الشخص الأول، و24,808 ساعة من عروض روبوتية صناعية تم إنشاؤها استناداً إلى هذه الفيديوهات.

أعلنت الشركة أن النموذج حصل على المركز الأول في RoboChallenge Table30 v1 في فئة النماذج العامة. ووفقاً لمعلومات Alibaba، أظهرت Qwen-RobotManip أيضاً مقاومة للتعليمات الجديدة، والأجسام غير المعروفة، ونقل المهارات بين الروبوتات المختلفة.

Qwen-RobotWorld: نموذج العالم للروبوتات

Qwen-RobotWorld هو نموذج مرئي للعالم، يُدار بواسطة اللغة الطبيعية. يجب أن يتوقع كيف سيتطور المشهد بعد تنفيذ فعل معين.

المصدر: Qwen-RobotWorld. على سبيل المثال، يتلقى النموذج الملاحظة الحالية والأمر النصي، ثم يولد حالة مستقبلية محتملة للبيئة. يمكن استخدام هذا النهج في التعاملات، والقيادة الذاتية، والتنقل، والتخطيط، وإنشاء بيانات تدريب صناعية للروبوتات.

لتدريب Qwen-RobotWorld، جمعت الفريق مجموعة بيانات Embodied World Knowledge. تتضمن 8.6 مليون زوج من «فيديو-نص» وأكثر من 200 مليون إطار، وتغطي أكثر من 20 نوعاً من منصات الروبوتات وأكثر من 500 فئة من الأفعال.

قالت Alibaba إن Qwen-RobotWorld حصلت على المركز الأول في EWMBench وDreamGen Bench، وتفوقت على جميع النماذج المفتوحة في WorldModelBench وPBench. كما يُذكر في الوصف الفني أن النموذج يُظهر توافقاً عالياً مع القوانين الفيزيائية الأساسية — الحركة، والحفاظ على الكتلة، والسوائل والجاذبية.

لا تزال المسافة طويلة أمام الروبوتات الجماعية

على الرغم من النتائج المعلنة، لا تزال مجموعة Qwen-Robot Suite مجرد نماذج، وليست منصة روبوتات استهلاكية جاهزة. تواجه التطبيقات الحقيقية ضوضاء الحساسات، وتآكل المحركات، والظروف غير الاعتيادية، وأخطاء الإدراك، وعدداً هائلاً من السيناريوهات النادرة. العديد من المقاييس، التي تُقارن بها هذه الأنظمة، تُجرى في المحاكاة أو في ظروف تجريبية محدودة.

لم تكشف Alibaba بعد عن تكلفة الوصول، ومواعيد الإطلاق العام، وقائمة العملاء الذين يختبرون Qwen-Robot Suite حالياً.

تذكر أن Alibaba Cloud قدمت في أبريل نموذج وكيل Qwen3.6-Plus مع نافذة سياق تبلغ مليون رمز ودعم أدوات خارجية.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت