حشد الجماهير للدخول، جينغ دونغ يقصد "الاستخلاص السحري" للبيانات المجسدة

16 مارس، إصدار JD.com بيانًا حول إنشاء أكبر مركز لجمع بيانات الذكاء الجسدي على مستوى العالم والأكثر شمولاً من حيث السيناريوهات، يسلط الضوء على قطاع الروبوتات الذي ظل في الظل لفترة بعد أن سرق لحم السلطعون الأضواء.

من ناحية ما، تعتبر هذه حركة إنتاج ضخمة للبيانات ذات طابع صناعي قوي.

يشمل هذا التحرك أكثر من 100 ألف موظف داخلي، وما يصل إلى 500 ألف من العاملين في مختلف الصناعات خارجيًا، وحتى في مدينة سوخويان، تم حشد أكثر من 100 ألف مواطن—هذه الحملة غير المسبوقة، محاولة باستخدام الحجم كجماليات عنف، لاختراق أضعف نقطة في الذكاء الجسدي حاليًا: نقص البيانات.

في ظل تراجع نماذج الهيكلية وشفافية حاجز القدرة الحاسوبية، أصبحت البيانات عالية الجودة للتفاعل الفيزيائي ضرورية لتمكين الروبوتات من الانتقال الحقيقي إلى مختلف القطاعات.

هذه العملية، التي وُصفت بأنها “أكبر حملة لجمع البيانات في تاريخ البشرية”، تكشف عن توافق صناعي: عندما يتطور “المخ الصغير” المسؤول عن التحكم في الحركة في الذكاء الجسدي، يصبح السؤال كيف نغذي عقولًا تفهم العالم الفيزيائي بشكل أفضل باستخدام بيانات عالية الجودة، هو المعركة الأساسية التي تحدد مستقبل الصناعة.

من سردية JD.com الكبرى إلى الواقع الدقيق للصناعة، من غير الواضح ما إذا كانت البيانات الناتجة عن مئات الآلاف من الأشخاص هي منجم ذهب أم رمال.

الموظفون المندمجون

تجرؤ JD.com على المبادرة، ويجب عليها ذلك، لأنها تعتمد على سلسلة إمدادها المعقدة والضخمة.

على عكس شركات الإنترنت البرمجية، فإن JD.com هو كيان تفاعلي في العالم المادي، ونجاح الذكاء الجسدي يعتمد مباشرة على تكاليف الأداء والكفاءة التشغيلية خلال السنوات العشر القادمة.

هذا التوجه مرتبط بشكل عميق ببيئة صناعة الروبوتات في منطقة ييزهوان في بكين.

حاليًا، تجمع منطقة ييزهوان أكثر من 300 شركة ذات صلة بالروبوتات، وتبلغ قيمة سلاسل الصناعة أكثر من 10 مليارات يوان، مع أكثر من 40 سيناريو تطبيق حقيقي، مما يجعلها مركزًا رئيسيًا لصناعة الروبوتات البشرية في الصين. وكون JD.com شركة رائدة في المنطقة، أطلقت سابقًا خطة تسريع لصناعة الروبوتات.

الاستثمار الكبير في مركز جمع البيانات والبنية التحتية الناعمة، هو في الواقع تعويض عن الحلقة الأضعف في سلسلة الصناعة. توفر ييزهوان “الجسد” وبيئة الاختبار، بينما تحاول JD.com تغذية الروبوتات بمعرفة وفهم العالم الحقيقي من خلال سيناريوهات ضخمة.

هذا التناغم بين التكنولوجيا الناعمة والصلبة، يسعى لبناء حلقة تجارية مغلقة من البيانات إلى تحديث الأجهزة.

تنسيق مئات الآلاف من الأشخاص ليس مهمة سهلة.

وفقًا للخطة، ستغطي السيناريوهات جمع البيانات في مجالات اللوجستيات والصناعة والتجزئة. وفي الممارسة العملية، يعتمد ذلك على شبكة إدارة رقمية موجودة بالفعل لدى JD.com. على سبيل المثال، يمكن أن يرتدي العاملون في التوصيل والتخزين أجهزة قابلة للارتداء مزودة بكاميرات، وأجهزة استشعار قوة، لأداء مهامهم اليومية.

من وجهة نظر الموظفين في الخط الأمامي والمواطنين في سوخويان، هذه الحملة معقدة جدًا.

يصبح الموظفون بشكل غير مرئي معلمين للبيانات للروبوتات، وهدف هذه الروبوتات المستقبلية هو استبدال العمالة ذات الجهد العالي. كيف نتصمم نظام حوافز وأرباح عادل، لتجنب مقاومة الموظفين، هو أحد التحديات التي تواجه JD.com.

ومع ذلك، لم يتم بعد تطبيق هذه الخطط بشكل واضح على مستوى الموظفين.

قال موظف في بكين لـ"وول ستريت جورنال" إنه لم يسمع عن الأمر بعد. في رأيه، إذا كانت هناك مكافآت مناسبة، فهي تعتبر نوعًا من السوق، ويختار الموظفون المشاركة من عدمه حسب رغباتهم. وأكد موظف آخر في سوخويان لـ"وول ستريت جورنال" أنه لم يتلقَ إشعارًا بعد.

على الرغم من أن التصريحات الرسمية تقول إن “جميع جمع البيانات سيتم وفقًا للقانون واللوائح”، إلا أن الواقع غالبًا أكثر تعقيدًا.

بالنسبة لسيناريو التوصيل، خط الإنتاج في المستودعات قياسي، لكن التوصيل إلى المنازل، والسيناريوهات التجارية التي تتطلب جمع بيانات عن ملامح الوجه وعادات الخصوصية للمستهلكين، تجعل الأمر أكثر حساسية.

وفي ظل تزايد التشريعات المتعلقة بالامتثال للبيانات، فإن التكاليف القانونية لتنظيف وتطهير البيانات غير المنظمة التي يجمعها مئات الآلاف من الأشخاص قد تكون رقمًا فلكيًا.

مفارقة مورافيك

في عام 1988، توصل عالم الروبوتات هانس مورافيك إلى استنتاج:

“من السهل جعل الحواسيب تصل إلى مستوى البالغين في اختبارات الذكاء أو الشطرنج، لكن من الصعب جدًا أن تمتلك قدرات إدراكية وحركية لطفل عمره سنة، أو أن تفعل ذلك تقريبًا.”

اليوم، يعكس مفهوم الذكاء الجسدي بشكل رئيسي مفارقة مورافيك في صناعة البيانات الفارغة.

نجاح النماذج الكبيرة يعتمد على استهلاك تريليونات النصوص عالية الجودة التي تراكمت على مدى ثلاثين عامًا من الإنترنت. لكن العالم الفيزيائي لا يملك الإنترنت الخاص به. لتحقيق مبدأ التوسع في العالم الحقيقي، يواجه الذكاء الجسدي جدارًا هائلًا من البيانات.

الجهود الحالية التي تبذلها JD.com تركز على هذا التحدي، وهو العقبة وراء جمع البيانات.

أولًا، مشكلة محدودية المحاكاة بحاجة إلى حل.

حاليًا، انقسمت طرق جمع البيانات بشكل كبير، وتواجه كل منها قيودها.

معظم الشركات الناشئة تعتمد على بيئات محاكاة، مثل Isaac Sim من NVIDIA أو MuJoCo، التي تسمح للروبوتات بالتعلم المعزز في العالم الافتراضي مئات الملايين من المرات. هذه الطرق منخفضة التكلفة وسريعة، ولا تتطلب إصلاحات مادية بعد الأخطاء.

لكن، المتخصصون يزداد وعيهم بحدود “Sim-to-Real”.

تعقيد العالم الفيزيائي لا يقتصر على التغيرات البصرية، بل يشمل ردود فعل تلامس دقيقة، مثل مرونة الكابلات، سحب الملابس غير الصلبة، احتكاك المسمار عند التثبيت، وحتى الضوضاء الكهرومغناطيسية في المستشعرات.

القدرة الحالية لمحركات الفيزياء لا يمكنها محاكاة هذه القوانين الفيزيائية الدقيقة ذات الأبعاد العالية وغير الخطية. مما يؤدي إلى أن النماذج التي تعمل بشكل مثالي في المحاكاة، عند نشرها على الأجهزة الحقيقية، تظهر أخطاء حادة أو تشوهات في الحركة.

وبما أن الفجوة في المحاكاة قائمة، فالحل هو العودة إلى العالم الحقيقي.

من Mobile ALOHA في ستانفورد إلى شركات مثل Figure AI، YuShu، Zhiyuan، يستخدم الكثيرون الآن التحكم عن بعد—أي أن الإنسان يرتدي ملابس تتبع الحركة أو يستخدم أجهزة VR، ويسيطر على الروبوتات كما لو كانت أفرادًا، لتسجيل البيانات من منظور الشخص الأول، بما في ذلك الصور، زوايا المفاصل، وقوى التلامس.

هذه الطريقة تعتبر الآن أعلى جودة لجمع البيانات، لكن، هذه تواجه ثاني أكبر مشكلة تجارية في جمع البيانات، وهي عدم جدوى اقتصادية واضحة.

تقدر الصناعة أن تكلفة أجهزة الروبوت البشري الكامل تصل إلى مئات الآلاف أو الملايين من اليوانات، بينما يتطلب جمع البيانات الفعالة عبر التحكم عن بعد تكاليف عالية من حيث الأجهزة والأيدي العاملة.

ووفقًا لوول ستريت جورنال، فإن تكلفة جمع وتنظيف بيانات تفاعلية معقدة عالية الجودة قد تصل إلى مئات الدولارات لكل عملية، مع معدل فشل مرتفع.

هذه النمطية اليدوية، التي تعتمد على جمع البيانات يدويًا، لا يمكنها دعم تطور الذكاء الجسدي ليصبح عامًا، والذي يحتاج إلى مئات المليارات من المعلمات.

لخفض الحواجز، أطلقت شركات عملاقة مثل جوجل مبادرات مثل Open X-Embodiment، التي تهدف إلى تجميع البيانات من المختبرات العالمية لاستخدامها عبر الصناعة. وهناك شركات محلية أيضًا تفتح مجموعات بيانات حقيقية بملايين الساعات.

لكن، هناك مشكلة أخرى مخفية، وهي التحدي الهندسي الأكبر: التجزئة الشديدة في الأجهزة الروبوتية. فكل نوع من الروبوتات—كلب، بعجلات، روبوت بشري ثنائي القدم، وحتى من مصنعين مختلفين—يختلف في مفاصلها، عزم محركاتها، توزيع المستشعرات، ومركز ثقلها.

بيانات الالتقاط عالية الجودة التي تم جمعها على ذراع UR5، لا يمكن نقلها مباشرة إلى روبوت تيسلا Optimus أو روبوتات اللوجستيات الخاصة بـ JD.com.

هذه الصعوبة في “التحويل بين الأجسام” تسببت في أن معظم البيانات المفتوحة أصبحت جزرًا منفصلة، يصعب توسيعها.

ربما، في ظل هذه التحديات الثلاثة، تغيرت المنطق التجاري في مسار الذكاء الجسدي بشكل جوهري: من يملك سيناريوهات واقعية، يملك جدار حماية مستمر من البيانات عالية الجودة والرخيصة.

وهذا يفسر لماذا اختارت Tesla و JD.com مسارات مختلفة تمامًا عن الشركات الناشئة التي تركز على الأجهزة فقط.

تسلا، بفضل مصانعها الضخمة، تتيح لـ Optimus التعلم مباشرة على خطوط تجميع البطاريات، بينما JD.com تحاول بناء خط إنتاج بيانات شبه آلي عبر شبكتها اللوجستية، مئات الآلاف من العمال، ونظام البيع بالتجزئة المادي.

هذه الاستراتيجية تحول حواجز سلسلة التوريد إلى حواجز بيانات في عصر الذكاء الاصطناعي.

وفي المقابل، العديد من الشركات الناشئة التي لا تملك سيناريوهات خاصة بها، مضطرة للتحول—إما أن تبيع الأجهزة للجامعات ومراكز البحث بأسعار منخفضة، مقابل مشاركة الباحثين في البيانات؛ أو أن تستأجر مساحات في المصانع، أو تتعاقد مع مزودي خدمات البيانات مثل JianZhi لتخصيص البيانات.

يمكن القول إن، مشاركة JD.com أزالت الستار عن خفايا صناعة الذكاء الجسدي، ودخلت في مرحلة تنافسية تعتمد على التمويل، والسيناريوهات، والموارد البشرية.

وفي مواجهة نقص البيانات، تتضاءل حواجز الخوارزميات، بينما تتجمع الشركات الكبرى التي تملك مدخلات التفاعل الفيزيائي الحقيقي، بشكل خفي، حول شبكة الوصول إلى الذكاء العام الاصطناعي.

المزيد من البيانات عالية الجودة

في مواجهة خطة JD.com لجمع أكثر من 10 ملايين ساعة من البيانات الحقيقية خلال عامين، رد فعل الصناعة ليس حماسيًا موحدًا، بل أكثر هدوءًا وتدقيقًا.

في سياق الذكاء الجسدي، جودة البيانات ونوعها، أهم بكثير من مجرد مدة جمعها.

تشير صناعة الخوارزميات إلى أن المشكلة الأساسية الحالية ليست في الفيديو من منظور الشخص الأول، بل في “زوج الحالة-الفعل” الذي يتضمن ردود فعل فيزيائية دقيقة.

على سبيل المثال، المواطنون في سوخويان يحملون كاميرات أثناء التسوق، أو العاملون في التوصيل يسجلون عمليات التسليم، مما ينتج عنه كميات هائلة من البيانات المرئية العامة على الإنترنت.

هذه البيانات مهمة لبناء نماذج العالم للروبوتات، وفهم ما هو الباب، وما هو التفاح، وهو أمر ذو قيمة عالية؛ لكن، بالنسبة لتدريب استراتيجيات التحكم في الروبوتات، ومعرفة القوة التي يجب أن تُستخدم لضغط التفاح دون كسره، فإن هذه البيانات البصرية وحدها غير كافية.

قال أحد خبراء الروبوتات لوول ستريت جورنال، إن الروبوتات تفتقر إلى البيانات ذات القيمة، خاصة البيانات الحقيقية للروبوتات. ويرى أن عملية JD.com تظل نوعًا من أعمال التعاقد الخارجي، تقدم الموظفين والموقع.

عند القيام بالقبض الفيزيائي، تتطلب الأمور توازنًا معقدًا في اللمس، والقوة، وتعديلات في الإحداثيات الفضائية، وهذه المعرفة عالية الأبعاد غير مرئية، ولا يمكن التقاطها بواسطة أجهزة قابلة للارتداء العادية. وإذا كانت مئات الآلاف من القوى البشرية تساهم فقط بالفيديو، فإن معدل التحويل إلى أفعال قابلة للتنفيذ على الروبوت سيكون مرتفعًا جدًا.

قال مسؤول في شركة روبوتات رائدة محليًا، إن المشكلة الأساسية في الصناعة هي “نقص معيار موحد لتعريف مجموعات البيانات”.

على سبيل المثال، تختلف مفاصل الروبوتات، ومواقع المستشعرات، وأنواع المحركات، فكيف يمكن أن تُعاد توجيه البيانات المجمعة من قبل JD.com إلى أنواع مختلفة من الروبوتات ذات التكوينات المختلفة؟

بدون معايير أساسية موحدة، قد تتحول هذه الـ10 ملايين ساعة من البيانات إلى تغذية خاصة بروبوتات JD.com، ويصعب أن تكون أساسًا لتقدم الصناعة بشكل عام.

وهذا ربما يفسر لماذا ركزت خطة العام الأول على “مليون ساعة من بيانات الروبوتات”. فالمسار الحقيقي لتطوير الصناعة هو عبر تدريب نماذج عامة من الفيديوهات البشرية، وتخصيص البيانات عالية الجودة لروبوتات التكوينات المختلفة، والتعلم المعزز للتطوير الذاتي.

إعلان JD.com عن إنشاء مركز لجمع بيانات الذكاء الجسدي، يمثل بداية محاولة الشركات المحلية استخدام منهجيات هندسية ومنهجية واسعة لمواجهة نقص البيانات في صناعة الروبوتات.

من خلال دمج السيناريوهات الواقعية والموارد البشرية الضخمة، يمكن أن يوفر ذلك مسارًا جديدًا لتراكم البيانات.

لكن، لتحقيق “الذكاء الناجم”، لا يكفي مجرد زيادة الحجم.

كيفية ضمان أبعاد و جودة البيانات في عمليات الجمع الضخمة، وكيفية وضع معايير موحدة للبيانات، وكيفية التعامل بشكل صحيح مع قضايا الخصوصية والامتثال أثناء التوسع، ستكون تحديات حاسمة للشركات والصناعة بأكملها في مرحلة التحول التجاري.

تحذيرات المخاطر وشروط الإعفاء

        السوق محفوف بالمخاطر، والاستثمار يتطلب الحذر. هذا المقال لا يشكل نصيحة استثمارية شخصية، ولم يأخذ في الاعتبار أهداف أو أوضاع مالية خاصة للمستخدم. يجب على المستخدمين تقييم مدى توافق الآراء أو الأفكار الواردة مع ظروفهم الخاصة. يتحمل المستخدمون مسؤولية استثماراتهم.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.46Kعدد الحائزين:2
    0.55%
  • القيمة السوقية:$2.44Kعدد الحائزين:2
    0.07%
  • القيمة السوقية:$2.39Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • تثبيت