يوشو تتحقق من اتجاه جديد: ساحة المعركة الأساسية للذكاء الجسدي ليست فقط النموذج.

robot
إنشاء الملخص قيد التقدم

المنافسة في مجال الذكاء الجسدي تدخل مرحلة جديدة. مع إصدار شركة Yushu Technology لنموذج WVLA2.0 الكبير وإتمام عرض توضيحي فعلي بدون تحكم عن بُعد، أصبحت الصناعة تدرك بوضوح أن الحاجز الأساسي في هذه المنافسة لا يعتمد فقط على حجم النموذج، بل يشمل قدرات كاملة تشمل تصميم الهندسة المعمارية منخفضة الكمون، التكامل المنسق بين البرامج والأجهزة، وتراكم البيانات الخاصة بالكيان.

وفقًا لتقرير بحثي صادر عن نومورا الدولية في 28 يونيو، قام المحللون بزيارة ميدانية لشركة Yushu Technology في 15 يونيو. في العرض التوضيحي، أكمل روبوت G1 المزود بـ WVLA2.0 (نموذج العالم-الرؤية-اللغة-الفعل) ست مهام متتالية بشكل مستقل دون تحكم عن بُعد في بيئة غرفة اجتماعات تعرضت للتشويش، مع دورة استدلال تبلغ حوالي 90 مللي ثانية، أي حوالي عشر تكرارات في الثانية. هذا هو الإصدار الأول الذي يمتلك إمكانيات نشر تجارية بعد عامين من البحث والتطوير من قبل Yushu. تعتبر الإدارة أن التصنيع الصناعي - تجميع محركات المفاصل، التحميل والتفريغ، معالجة الأدوات والتركيبات - هو السيناريو الأول للانتشار التجاري، وتعتبر بيانات التشغيل الفعلية الواسعة النطاق من أسطول الروبوتات العالمي أصولًا أساسية.

كما سلط تقرير نومورا الضوء على إطار عمل NeuralAxis الذي أصدرته NXP في COMPUTEX 2026. هذا الإطار بقيادة الرئيس التنفيذي لـ NXP، رافائيل سوتومايور، ويتماشى بشكل كبير مع المسار الهندسي لـ Yushu - حيث أن العقبة الحقيقية للذكاء الجسدي لا تكمن في حجم استدلال نماذج اللغة، بل في القدرة على بناء طبقة تحكم حافة تعمل مثل انعكاسات النخاع الشوكي البشري، بكمون يصل إلى 40 مللي ثانية.

المعنى المباشر لهذه التطورات للمستثمرين هو: يتطور مشهد المنافسة في الذكاء الجسدي من "من يملك نموذجًا أقوى" إلى "من يملك نظامًا أكثر اكتمالًا". الخندق الذي بنته Yushu من خلال التكامل الكامل للبحث والتطوير الذاتي وبيانات الكيان هو ما يصعب على مزودي نماذج السحابة البحتة تقليده.

NeuralAxis: إعادة تعريف حدود بنية النظام للذكاء الجسدي

يستند إطار عمل NeuralAxis (بنية المحور العصبي) من NXP إلى الجهاز العصبي البشري، حيث يقسم منطق التحكم في الذكاء الجسدي إلى ثلاثة مستويات مفصولة ولكنها منسقة: طبقة الاستدلال المقابلة للقشرة الدماغية (كمون حوالي 300 مللي ثانية)، طبقة التنسيق المقابلة للمخيخ (مسؤولة عن التحكم الحركي والتوازن)، وطبقة الانعكاس المقابلة للنخاع الشوكي - كمون يصل إلى 40 مللي ثانية، منشورة على الحافة قرب المشغلات.

بالنسبة للروبوتات البشرية، هذا الإطار هو الأكثر تأثيرًا.

يدعو NeuralAxis إلى استبدال "الدماغ المركزي" المركز بمعالجات انعكاسية موزعة - نشر قدرات اتخاذ القرار المحلية في المفاصل واليدين والقدمين، لتحقيق تنفيذ محلي لإجراءات مثل التحكم في قوة القبضة وتوازن الكاحل، واستعادة التوازن والإمساك والوضعية والمشي في سلسلة خلال 40 مللي ثانية. فصل الاستدلال عن التحكم الحركي يسمح أيضًا بإضافة مهارات جديدة باستمرار مع الحفاظ على استقرار الحركة.

الامتدادات التجارية لهذا الإطار تستحق الاهتمام أيضًا. تظهر أبحاث الصناعة من نومورا أن مقارنة بالحلول الآلية التقليدية، يمكن لهيكل NeuralAxis أن يحقق تحسينات كبيرة في كفاءة التصنيع، كما من المتوقع أن ترتفع مبيعات روبوتات التشخيص بشكل كبير. بالإضافة إلى ذلك، يمكن لنفس البنية ضغط الكمون من طرف إلى طرف للطائرات بدون طيار إلى أقل من 20 مللي ثانية، وتقسيم منطق التحكم للسيارات المعرفة بالبرمجيات إلى مستويات الاستدلال والتنسيق والمناطق الحرجة للسلامة.

WVLA2.0: مسار تنفيذ دمج النماذج والتنسيق بين البرامج والأجهزة

يظهر المسار التقني لـ WVLA2.0 من Yushu Technology انقسامًا واضحًا عن التيار الرئيسي في الصناعة.

تراهن معظم الحلول المماثلة على التوليد المباشر (من طرف إلى طرف) لنماذج VLA (الرؤية-اللغة-الفعل)، بينما يدمج WVLA2.0 قدرات التنبؤ لنموذج WMA (نموذج العالم-الفعل) مع توليد الفعل لـ VLA، مما يحقق ترقية شاملة في فهم المهام عالية المستوى، الاستدلال الدلالي المكاني ثنائي/ثلاثي الأبعاد، توليد الأفعال المقيدة بالديناميكيات، والقدرة على مقاومة التشويش.

على مستوى الإدراك، يدمج النظام أربع تدفقات بصرية متوازية: كاميرا عمق RealSense، ليدار Livox MID360، وكاميرتان جانبيتان، لبناء تمثيل مكاني بزاوية 360 درجة، مع تأخير تحديث الموقع في حدود 10 مللي ثانية تحت ظروف التشويش. في تصميم التنسيق بين البرامج والأجهزة، تُرسل معلمات الأفعال بعد الاستدلال عبر ناقل CAN إلى 23 درجة حرية لمفاصل G1، بفضل وحدة التحكم الحركي "المخيخ" ذاتية التطوير من Yushu، حيث يمكن التحكم في خطأ التموضع عند التقاط أجسام وزنها أقل من 2 كجم بيد واحدة في حدود 5 مم.

في بنية الحوسبة، يضغط WVLA2.0 قوة الحوسبة الحافة إلى أقل من 100 TOPS، حيث يعمل بالكامل على NVIDIA Jetson Orin NX (NVDA US، غير مصنف) المثبت على G1 EDU، دون حاجة للاعتماد على السحابة. تقول الإدارة إن هذا التصميم يتجنب مخاطر انقطاع المهام الناتجة عن تأخير الشبكة أو انقطاع الاتصال.

تحول نموذج البيانات: "جمع البيانات بدون كيان" يصبح السائد

يعد التحول في نموذج جمع البيانات إشارة مهمة أخرى من هذا التقرير.

يظهر عرض Yushu أنه في تسجيل واحد بدون تدخل التحكم عن بُعد، يمكن لـ G1 إكمال مهام متعددة متتالية بشكل مستقل في بيئة مشوشة، مما يعني أن "جمع البيانات بدون كيان" أصبح النموذج السائد لإنتاج البيانات في الذكاء الجسدي، أي أن الروبوت يعتمد على إدراكه وقراراته الذاتية لتراكم البيانات بدلاً من الاعتماد على وضع العلامات اليدوية عن بُعد.

تشير أبحاث الصناعة من نومورا أيضًا إلى القيود الحالية: لا يزال النظام يعاني من فجوات في المناطق العمياء والإدراك الخلفي، سرعة التنفيذ بطيئة نسبيًا، دقة العمليات الدقيقة غير كافية، ويفقر بيانات قياسية لاختبارات معدل النجاح المستمر. هذه العيوب تحدد أيضًا الحدود الأولوية للانتشار التجاري القريب.

بناءً على ذلك، وضعت الإدارة خطة انتشار مرحلية: التصنيع الصناعي (تجميع محركات المفاصل، التحميل والتفريغ، معالجة الأدوات والتركيبات) هو أول سيناريو نظرًا لأن مصانع Yushu الخاصة يمكن أن توفر حلقة بيانات مغلقة؛ يليه فرز اللوجستيات وتجميع 3C المرن؛ أما سيناريوهات الرعاية المنزلية والطبية فهي أكثر صعوبة بسبب البيئات المفتوحة غير المنظمة، وتعتبر أهدافًا بعيدة المدى.

التكامل الكامل: بعدان للتمييز التنافسي لـ Yushu

يمكن تلخيص الاستنتاج الرئيسي لتقرير نومورا في حكم واحد: في عملية التسويق للذكاء الجسدي، قدرات النموذج مهمة، لكنها ليست المتغير الحاسم الوحيد.

تعرف إدارة Yushu الميزة التنافسية للشركة في مستويين: الأول هو القدرة على التكامل الكامل للبحث والتطوير الذاتي من الإدراك إلى النموذج إلى التحكم الحركي؛ والثاني هو تراكم بيانات التشغيل الفعلية واسعة النطاق من أسطول الروبوتات العالمي. هذان الأصلان يعززان بعضهما البعض - الأجهزة ذاتية التطوير تنتج بيانات حصرية، والبيانات تغذي تكرار النموذج، مما يشكل حلقة مغلقة يصعب على مزودي نماذج السحابة الدخول فيها.

من منظور المشهد التنافسي للسوق، يشير منطق تنفيذ إطار NeuralAxis و WVLA2.0 معًا إلى نفس الاستنتاج: ساحة المعركة الأساسية للذكاء الجسدي تتكشف في طبقة بنية النظام وطبقة البيانات في نفس الوقت. بالنسبة للمستثمرين، يجب أن يمتد بُعد تقييم المشاركين في السباق من "قدرات النموذج" الوحيدة إلى قدرات تكامل النظام الأكثر اكتمالًا وحجم تراكم بيانات الكيان الفعلية.


المحتوى الرائع أعلاه مأخوذ من منصة التداول Chasing Fire.

للحصول على تفسيرات أكثر تفصيلاً، بما في ذلك التفسيرات في الوقت الفعلي، والأبحاث المباشرة، يرجى الانضمام إلى [**عضوية Chasing Fire السنوية**]

![](https://img-cdn.gateio.im/social/moments-f187f887a1-07b7e18c28-8b7abd-62a40f)

بيان المخاطر وإخلاء المسؤولية

          

            السوق يحمل مخاطر، والاستثمار يجب أن يكون بحذر. هذه المقالة لا تشكل نصيحة استثمارية شخصية، ولا تأخذ في الاعتبار أهداف الاستثمار الخاصة، أو الوضع المالي، أو احتياجات المستخدمين الفرديين. يجب على المستخدمين النظر فيما إذا كانت أي آراء أو وجهات نظر أو استنتاجات في هذه المقالة تتوافق مع ظروفهم الخاصة. الاستثمار بناءً على ذلك يكون على مسؤوليتهم الشخصية.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت