جوجل ديب مايند تطلق جيميني روبوتيكس-إر 1.6، روبوت سبوت قادر الآن على قراءة لوحة العدادات تلقائيًا

robot
إنشاء الملخص قيد التقدم

أخبار ME News، 14 أبريل (بتوقيت UTC+8)، وفقًا لمراقبة 1M AI News، أطلقت شركة جوجل DeepMind نموذج Gemini Robotics-ER 1.6، المصمم للتفكير العميق على مستوى عالٍ للروبوتات، مع تحسينات ملحوظة مقارنة بالإصدارات السابقة ER 1.5 و Gemini 3.0 Flash في المجالين الفضائي والفهم متعدد الزوايا. النموذج متاح الآن للمطورين عبر واجهة برمجة التطبيقات Gemini و Google AI Studio. تشمل الترقيات الأساسية ثلاث قدرات: 1. تحسين دقة التوجيه (pointing): يمكن استخدامها للكشف الدقيق عن الأجسام، العد، الاستنتاجات المتعلقة بالعلاقات المكانية (مثل “حدد جميع الأجسام التي يمكن وضعها في الكوب الأزرق”) وتخطيط مسارات الحركة، مع القدرة على رفض التوجيه الصحيح للأجسام غير الموجودة في الصورة 2. الكشف الناجح من زوايا متعددة: يمكن للروبوت الآن دمج صور من كاميرات متعددة لتحديد ما إذا كانت المهمة قد اكتملت، مع الحفاظ على الدقة حتى في حالات التعتيم أو البيئة الديناميكية 3. القدرة الجديدة على قراءة الأدوات: يمكنها تفسير مقاييس الضغط الدائرية، مؤشرات مستوى السائل الرأسية، والشاشات الرقمية، من خلال الرؤية الذكية (الاستنتاج البصري + تنفيذ الكود) لتحقيق استنتاج تدريجي، حيث يتم تكبير المنطقة التفصيلية أولاً، ثم استخدام التوجيه والحسابات البرمجية لقياس النسب والفواصل، وأخيرًا دمج المعرفة العالمية للوصول إلى القراءة. تعتمد قدرة قراءة الأدوات على التعاون بين DeepMind و Boston Dynamics. أعلنت Boston Dynamics في نفس اليوم أنها دمجت Gemini و Gemini Robotics-ER 1.6 في منتجها Orbit AIVI-Learning، وتم إطلاقه لجميع عملاء AIVI-Learning في 8 أبريل. بعد الدمج، تم إضافة دعم لوحدة القياس (gauges)، حيث يمكن الآن للروبوت الرباعي الأرجل Spot أن يقوم بالمراقبة الذاتية في المنشآت الصناعية وقراءة بيانات الأدوات مثل مقاييس الضغط. وذكرت Boston Dynamics أن بفضل قدرات الاستنتاج في Gemini، شهدت أداء AIVI-Learning الأساسي ودقته في المهام مثل التفتيش البصري، وعد الأطباق، والكشف عن السوائل، تحسنًا أيضًا. وتقول DeepMind إن ER 1.6 هو “أكثر نماذج الروبوتات أمانًا” التي أطلقتها الشركة. في مهام الاستنتاج الفضائي المقاوم، تفوق بشكل كبير على ER 1.5 من حيث الالتزام بالتعليمات الأمنية. وفي اختبارات تحديد مخاطر السلامة استنادًا إلى تقارير الإصابات الحقيقية، كانت نماذج ER أعلى بنسبة 6% في سيناريوهات النصوص، و10% في سيناريوهات الفيديو مقارنة بـ Gemini 3.0 Flash. (المصدر: BlockBeats)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت