العقود الآجلة
وصول إلى مئات العقود الدائمة
CFD
الذهب
منصّة واحدة للأصول التقليدية العالمية
الخیارات المتاحة
Hot
تداول خيارات الفانيلا على الطريقة الأوروبية
الحساب الموحد
زيادة كفاءة رأس المال إلى أقصى حد
التداول التجريبي
مقدمة حول تداول العقود الآجلة
استعد لتداول العقود الآجلة
أحداث مستقبلية
"انضم إلى الفعاليات لكسب المكافآت "
التداول التجريبي
استخدم الأموال الافتراضية لتجربة التداول بدون مخاطر
CFD
مشتقات CFD للأسهم الأمريكية
الأسهم الأمريكية
وصول إلى الأسهم الأمريكية وصناديق ETF الحقيقية
أسهم هونغ كونغ
تداول أسهم عالية الجودة مدرجة في هونغ كونغ
الأسهم الكورية
SK Hynix
تداول الأسهم الكورية الحقيقية واستثمر في الأصول الشائعة
العقود الآجلة للأسهم
رافع مالية عالية، وتداول على مدار 24/7
الأسهم المُرمَّزة
مدعومة بأصول أسهم حقيقية
IPO Access
افتح الوصول الكامل إلى الاكتتابات العامة للأسهم العالمية
GUSD
سك GUSD للحصول على عوائد أصول العالم الحقيقي (RWA) للخزانة
أنشطة الأسهم
تداول الأسهم الرائجة واحصل على إنزالات جوية سخية
إطلاق
CandyDrop
اجمع الحلوى لتحصل على توزيعات مجانية.
منصة الإطلاق
-التخزين السريع، واربح رموزًا مميزة جديدة محتملة!
HODLer Airdrop
احتفظ بـ GT واحصل على توزيعات مجانية ضخمة مجانًا
IPO Access
افتح الوصول الكامل إلى الاكتتابات العامة للأسهم العالمية
نقاط Alpha
تداول الأصول على السلسلة واكسب التوزيعات المجانية
نقاط العقود الآجلة
اكسب نقاط العقود الآجلة وطالب بمكافآت التوزيع المجاني
عروض ترويجية
AI
Gate AI
شريكك الذكي الشامل في الذكاء الاصطناعي
Gate AI Bot
استخدم Gate AI مباشرة في تطبيقك الاجتماعي
GateClaw
Gate الأزرق، جاهز للاستخدام
Gate for AI Agent
البنية التحتية للذكاء الاصطناعي، Gate MCP، Skills و CLI
Gate Skills Hub
أكثر من 10 آلاف مهارة
من المكتب إلى التداول، مكتبة المهارات الشاملة تجعل الذكاء الاصطناعي أكثر فعالية
> عجلة البيانات أم عينات مكررة؟ حان الوقت لتوديع الذكاء الاصطناعي الفيزيائي لـ«عبادة الساعات»
عالم الروبوتات أنيميش غارغ، الذي شغل مناصب سابقة ومشتركة في جامعة تورنتو ويعمل حاليًا في معهد جورجيا للتكنولوجيا، في مقال بعنوان "Moneyball for Physical AI"، شبه سباق البيانات في الذكاء الاصطناعي التجسيدي بلحظة "كرة المال" في تاريخ البيسبول.
يريد تحدي سرد التمويل الشائع بشكل متزايد: أن شركات الروبوتات، بمجرد تكديس المزيد من التشغيل عن بُعد، والمزيد من النشر الحقيقي، والمزيد من ساعات التشغيل، يمكنها تشكيل حلقة تغذية راجعة للبيانات. بالنسبة للمستثمرين، هذه ليست معركة كلامية أكاديمية. غالبًا ما يتم تعبئة هيكل التكاليف وسرعة التسويق وحواجز النموذج لشركات الذكاء الاصطناعي التجسيدي في العبارة الأربعة "حلقة البيانات المغلقة". إذا كانت الساعات المتراكمة لا تعادل تقدمًا فعالًا في النموذج، فيجب على السوق إعادة تقييم هذه الأصول البياناتية للشركات.
"ساعات البيانات" قد تكون خرافة معدل الضرب في صناعة الروبوتات
استعار غارغ المقارنة الكلاسيكية من فيلم "Moneyball". في عام 2002، فاز فريق أوكلاند أثلتكس بـ 103 مباراة بتشكيلة كانت من بين أقل الفرق من حيث الرواتب في الدوري، ولم يكن المفتاح شراء لاعبين أغلى، بل اكتشاف أن السوق قد قيمت اللاعبين بشكل خاطئ. يركز الكشافة التقليديون على معدل الضرب، وسرقة القواعد، والوضعية، لكن المؤشر الأكثر تفسيرًا لقدرة الفريق على التسجيل هو نسبة الوصول إلى القاعدة.
في رأيه، قد يكون الذكاء الاصطناعي الفيزيائي في مرحلة مماثلة. تعترف الصناعة بأن البيانات ضرورية لنماذج الروبوتات العامة، لكنها تميل إلى اعتبار المؤشر الأسهل عرضًا كأهم مؤشر: إجمالي ساعات التشغيل عن بُعد، عدد مسارات التعليم، عدد الروبوتات المنشورة، وقت تشغيل سيناريوهات الإنتاج.
تختلف طريقة توفير بيانات الروبوتات عن بيانات النصوص. يمكن لنماذج اللغة الكبيرة الحصول على كميات هائلة من النصوص منخفضة التكلفة من الإنترنت، ومكتبات الأكواد، والكتب، وصفحات الويب، ويكون عنق الزجاجة أكثر في القوة الحسابية، والتنظيف، وكفاءة التدريب. تحتاج نماذج الروبوتات إلى بيانات تحتوي على تفاعل فيزيائي، وردود فعل حركية، وتغيرات بيئية، ويجب إنشاء كل ساعة من البيانات الفعالة بشكل حقيقي، مع تكاليف خلفية للأجهزة، والعمالة، والموقع، وأجهزة الاستشعار، ومعالجة الفشل، والسلامة.
استخدم عالم الروبوتات كين غولدبرغ مصطلح "فجوة بيانات 100,000 عام" لوصف الفجوة بين بيانات الروبوتات وبيانات الذكاء الاصطناعي على نطاق الإنترنت. بشكل أكثر دقة، إذا تم تحويل بيانات النصوص والصور التي تستهلكها نماذج اللغة المرئية الكبيرة المعاصرة إلى وقت قراءة أو مشاهدة بشري، فإنها تعادل حوالي 100,000 عام، بينما تفتقر الروبوتات إلى بيانات تفاعل حقيقية بنفس الحجم. هذا القول لا يضع عتبة دقيقة لنماذج الروبوتات، بل يذكر الصناعة بأن بيانات التفاعل في العالم الحقيقي لا يمكن جمعها بتكلفة منخفضة مثل نصوص الويب.
هذا أيضًا سبب اعتراض غارغ على سرد "التشغيل عن بُعد في معامل العرق". يمكن للتشغيل عن بُعد بواسطة البشر أن ينتج بالفعل عينات تدريب كثيفة الحركة، ولكن إذا قامت الشركة بتقييم البيانات بناءً على إجمالي الساعات فقط، فقد تتدفق الأموال نحو عينات متكررة ومنخفضة الصعوبة ومنخفضة كثافة المعلومات، بدلاً من السيناريوهات الأكثر قدرة على تقليل معدلات الفشل.
ثلاثة أنواع من البيانات تشتري أشياء مختلفة
في تصنيف غارغ، تنقسم بيانات الذكاء الاصطناعي الفيزيائي تقريبًا إلى ثلاثة أنواع: بيانات المراقبة، وبيانات التدخل، وبيانات النشر. قد تكون جميعها مفيدة، لكن التكاليف والقيود وكثافة المعلومات تختلف بشكل كبير.
النوع الأول هو بيانات المراقبة، مثل فيديوهات منظور الشخص الأول أو منظور الشخص الثالث. ميزتها هي التكلفة المنخفضة والتغطية الواسعة، مما يساعد النموذج على فهم الأشياء، والفضاء، ونتائج الحركة، وتوزيع البيئة. العيب واضح أيضًا: يمكن للنموذج رؤية ما يحدث للإنسان أو الشيء، لكنه قد لا يعرف ما الإجراء الذي يجب أن يخرجه الروبوت في حالة معينة.
النوع الثاني هو بيانات التدخل، أي مسارات من الحالة إلى الفعل الناتجة عن التشغيل عن بُعد، والتعليم، والتدخل البشري. هذه البيانات أكثر مباشرة لتدريب الروبوتات لأنها تحتوي على سلسلة "رؤية شيء، كيفية الحركة، ما يحدث بعد الحركة". الثمن هو أن كل مسار عالي الجودة يجب شراؤه بالمال، وتكاليف العمالة والأجهزة لا يمكن أن تنخفض بسرعة مثل بيانات البرمجيات.
النوع الثالث هو بيانات النشر، أي بيانات القياس عن بُعد الناتجة عن تشغيل الروبوتات في سيناريوهات تجارية حقيقية. تبدو الأقرب إلى حلقة التغذية الراجعة التجارية: الروبوت يعمل، ويكسب المال، وينتج بيانات تدريب في نفس الوقت. لكن هنا فخ إحصائي.
السيناريوهات الروبوتية التي تنشر أولاً اليوم، عادة ما تكون السيناريوهات الأقل تغيرًا، والأكثر ثباتًا في العمليات، والأكثر تحكمًا في المخاطر، مثل المستودعات شديدة التنظيم، والمصانع، أو بيئات المهام الفردية. قد تكون كمية بيانات الإنتاج هذه كبيرة، لكن توزيعها ضيق، ومعدل التكرار مرتفع. بمجرد أن يتعلم النموذج الأنماط المحلية، تنخفض المعلومات الجديدة التي تجلبها كل ساعة تشغيل إضافية.
بيانات النشر ليست دون قيمة. ما هو ذو قيمة حقيقية، غالبًا ما ليس المقاطع العادية "الناجحة" الكثيرة، بل الفشل، والانحشار، والأشياء الشاذة، والظروف الحدودية، والاضطرابات النادرة. المشكلة هي أن هذه العينات طويلة الذيل لا تظهر بانتظام وفقًا للإيقاع الذي ترغب فيه الشركة، وتكون تكاليف اكتشافها وفرزها ومراجعتها أعلى.
المزيد من البيانات مفيد، لكن العينات المتكررة تصبح باهظة الثمن بسرعة
غارغ حذر في استعارة قانون القياس لنماذج اللغة: زيادة البيانات عادة ما تؤدي إلى انخفاض في خسارة النموذج، لكن العوائد تتناقص. إذا كانت العينات متكررة أو شبه متكررة أو من نفس التوزيع الضيق، فإن مساعدة البيانات الجديدة ستنخفض بشكل أسرع.
في مجال الروبوتات، هذه المشكلة أكثر وضوحًا. عندما يتعلم الروبوت التقاط صندوق معبأ ثابت من رف ثابت، قد تكون آلاف المرات الأولى من التعليم والفشل والتصحيح ذات قيمة كبيرة. بمجرد جمع الحركات والأشياء والإضاءة والمسارات بشكل متكرر، تصبح البيانات الجديدة أشبه بنسخ الخبرات المحلية التي تم تعلمها بالفعل.
هناك تجارب مماثلة في تدريب نماذج اللغة: العينات المتكررة وشبه المتكررة تهدر ميزانية التدريب، والتكرار المفرط قد يضر بالتعميم. لا يعمم غارغ هذه الاستنتاجات مباشرة على تدريب الروبوتات، لكنه يستخدمها لتوضيح اتجاه: قياس قيمة البيانات لا يمكن أن يعتمد فقط على الكمية، بل يجب أيضًا النظر إلى مدى الاختلاف بين العينات.
بالنسبة للذكاء الاصطناعي الفيزيائي، التنوع له معنيان على الأقل. الأول هو جعل النموذج يرى المزيد من الأشياء والفضاءات والمواد والإضاءات والانسدادات وطرق التشغيل. الثاني هو تجنب أن يكون النموذج جيدًا في توزيع مهام بسيط للغاية، ثم يفشل عند الانتقال إلى سيناريو مختلف قليلاً.
لذلك تصبح حالات الفشل طويلة الذيل حاسمة. العالم الفيزيائي الحقيقي ليس موزعًا بشكل متساوٍ، وغالبًا ما تحدد الشذوذات المنخفضة التردد القابلية التجارية: إزاحة طفيفة في وضع الجسم، تشوه في التغليف، انعكاس السطح، انزلاق القابض، تدخل بشري مفاجئ، خطأ استشعار، تغير في احتكاك الأرضية. بغض النظر عن مدى جودة أداء النموذج على العينات العادية، إذا لم يتمكن من التعامل مع هذه الأحداث الطرفية، فسيظل النشر معطلًا بسبب الفشل القليل.
حلقة النشر تصبح مجدية، تحتاج السيناريوهات المبكرة إلى أن تكون "جديدة" بما فيه الكفاية
ما يتحدىه هذا المقال حقًا، هو الطريق التجاري الشائع لشركات الذكاء الاصطناعي التجسيدي: نشر الروبوتات أولاً في سيناريوهات ضيقة، واستخدام التدخل البشري عن بُعد لضمان القابلية للاستخدام، مع جمع بيانات الإنتاج، ثم استخدام هذه البيانات لتدريب نماذج أقوى، لفتح المزيد من السيناريوهات.
يطلق غارغ على هذا الطريق اسم "neo-integrator". يحاول تجاوز تكلفة جمع البيانات البحتة، ووضع الروبوتات في الإنتاج التجاري، وجعل الإيرادات التشغيلية تعوض تكلفة البيانات. مقارنة ببناء مصانع تشغيل عن بُعد متخصصة، يبدو هذا الطريق أكثر كفاءة.
لكن حلقة التغذية الراجعة لها شرط مسبق: البيانات الناتجة عن السيناريوهات التجارية المبكرة، يجب أن تكون جديدة بما فيه الكفاية، ومتنوعة بما فيه الكفاية، لمساعدة النموذج على الانتقال إلى المزيد من المهام. إذا كانت سيناريوهات النشر مجرد مهام ضيقة منخفضة التغير ومنخفضة الإنتروبيا ومخصصة بشدة من حيث الهندسة، فإن البيانات ستشبع بسرعة. قد لا تحصل الشركة على حلقة تغذية راجعة لقدرات عامة، بل على مجموعة من المشاريع المخصصة التي تتطلب تكاملًا مستمرًا وصيانة ومعالجة استثنائية.
سيؤدي ذلك إلى نوعين من التكاليف. أولاً، كل دخول إلى سيناريو جديد يتطلب استثمارًا في تعديل البيئة، وتكييف العمليات، وتوفير الحماية من الفشل، وآليات السلامة. ثانيًا، إذا لم يصل النشر بعد إلى نقطة التعادل، فإن توسيع النطاق قد لا يعني جمع بيانات منخفضة التكلفة، بل قد يعني الحصول على خسائر مقابل عدد كبير من العينات منخفضة الجدة.
لذا، النشر المبكر ليس عديم الفائدة، لكنه يحتاج إلى نظرة أدق: كم من تغطية المهام الجديدة جلبه، وكم من عينات الفشل والشذوذ أنتجها، وهل يمكن لهذه العينات أن تنتقل إلى سيناريوهات أخرى، وبعد خصم تكاليف الأجهزة والعمالة والصيانة والتكامل، كم من تحسين النموذج تحققه كل دولار يتم إنفاقه.
سرد التقييم لا يمكن أن يسأل فقط عن عدد الساعات المتراكمة
الاقتراح الذي يقدمه غارغ ليس التوقف عن جمع البيانات، بل تغيير مقياس التقييم. يمكن أن تكون ساعات التشغيل المتراكمة وساعات التشغيل عن بُعد وعدد المسارات مؤشرات تشغيلية، لكن لا ينبغي اعتبارها مباشرة تقدمًا في النموذج.
الأسئلة الأكثر تفسيرًا تشمل: متى تشبع بيانات مهمة واحدة، وكم تكلفة التكامل الهندسي لإضافة مهمة جديدة، وكم عدد السيناريوهات والمجموعات الحركية المختلفة التي تغطيها البيانات، وكم من العينات في بيانات الإنتاج هي انحراف توزيع حقيقي وشذوذ، وكم من مقاطع النجاح العادية في تيار النشر يجب تصفيتها بدلاً من تغذية النموذج بها.
وبالمقابل للأنواع الثلاثة من البيانات، سيكون توزيع رأس المال مختلفًا. يجب أن تعطي بيانات المراقبة الأولوية للتكلفة المنخفضة والتنوع والتغطية الواسعة، لتوسيع حدود القدرات الأساسية. بعد تشبع المهمة الواحدة، يجب تحويل ميزانية بيانات التشغيل عن بُعد والتعليم عالية التكلفة نحو المزيد من المهام، بدلاً من الاستمرار في تكرار نفس الحركة. يجب أن تركز بيانات النشر على تصفية الفشل والظروف الحدودية والعينات خارج التوزيع، وتجاهل عدد كبير من سجلات التشغيل العادية منخفضة كثافة المعلومات.
هذه الأفكار لها تأثير واقعي على سرد التقييم للذكاء الاصطناعي الفيزيائي. شركة لديها المزيد من الروبوتات، ووقت تشغيل أطول، وفريق تشغيل عن بُعد أكبر، لا يعني تلقائيًا أن لديها حاجز نموذج أقوى. القدرة الأكثر صعوبة في النسخ، قد تكون الاستمرار في العثور على بيانات طويلة الذيل عالية القيمة، وتحديد متى تشبع فئة معينة من البيانات، وتغطية توزيعات مهام أكثر بتكلفة أقل.
لكن هذا لا يزال مجرد منظور لتوزيع رأس المال، وليس حكمًا صناعيًا نهائيًا. ما إذا كانت نماذج الروبوتات ستظهر عوائد حجم مشابهة لنماذج اللغة، وما إذا كانت بيانات النشر ستستمر في إنتاج معلومات جديدة في بعض السيناريوهات عالية الأبعاد، ومدى كفاءة النقل بين المهام المختلفة، كل هذا يحتاج إلى المزيد من النتائج التجريبية للإجابة.
تذكير غارغ يقع على سؤال أكثر تحديدًا: ربما "مؤشر كرة المال" للذكاء الاصطناعي الفيزيائي ليس ساعات البيانات، بل العينات الجديدة التي يشتريها كل دولار. بالنسبة لشركات الروبوتات التي لا تزال تروي قصص حلقة البيانات، ما يجب أن تنظر إليه السوق في النهاية قد لا يكون كم من الوقت تراكم، بل كم من المعلومات الجديدة تم إنتاجها في هذا الوقت.
انقر لمعرفة وظائف BlockBeats المفتوحة
مرحبًا بكم في الانضمام إلى مجتمع BlockBeats الرسمي:
قناة الاشتراك في Telegram: https://t.me/theblockbeats
قناة التواصل على Telegram: https://t.me/BlockBeats_App
حساب Twitter الرسمي: https://twitter.com/BlockBeatsAsia