جوجل ديب مايند تطلق جيميني روبوتيكس-إر 1.6، روبوت سبوت قادر الآن على قراءة لوحة العدادات تلقائيًا

robot
إنشاء الملخص قيد التقدم
أخبار ME News، 14 أبريل (بتوقيت UTC+8)، وفقًا لمراقبة 1M AI News، أطلقت شركة جوجل DeepMind نموذج Gemini Robotics-ER 1.6، المصمم للتفكير العميق على مستوى عالٍ للروبوتات، مع تحسينات ملحوظة مقارنة بالإصدارات السابقة ER 1.5 و Gemini 3.0 Flash في المجالين الفضائي والفهم متعدد الزوايا. النموذج متاح الآن للمطورين عبر واجهة برمجة التطبيقات Gemini و Google AI Studio. تشمل الترقيات الأساسية ثلاث قدرات: 1. تحسين دقة التوجيه (pointing): يمكن استخدامها للكشف الدقيق عن الأجسام، العد، الاستنتاجات المتعلقة بالعلاقات المكانية (مثل "حدد جميع الأجسام التي يمكن وضعها في الكوب الأزرق") وتخطيط مسارات الحركة، مع القدرة على رفض التوجيه الصحيح للأجسام غير الموجودة في الصورة 2. الكشف الناجح من زوايا متعددة: يمكن للروبوت الآن دمج صور من كاميرات متعددة لتحديد ما إذا كانت المهمة قد اكتملت، مع الحفاظ على الدقة حتى في حالات التعتيم أو البيئة الديناميكية 3. القدرة الجديدة على قراءة الأدوات: يمكنها تفسير عدادات الضغط الدائرية، مؤشرات مستوى السائل الرأسية، والشاشات الرقمية، من خلال الرؤية الذكية (الاستنتاج البصري + تنفيذ الكود) لتحقيق استنتاج تدريجي، حيث يتم تكبير المنطقة التفصيلية أولاً، ثم حساب النسب والفواصل عبر التوجيه والتنفيذ البرمجي، وأخيرًا استنتاج القراءة باستخدام المعرفة العالمية. تعتمد قدرة قراءة الأدوات على التعاون بين DeepMind و Boston Dynamics. أعلنت Boston Dynamics في نفس اليوم أنها دمجت Gemini و Gemini Robotics-ER 1.6 في منتجها Orbit AIVI-Learning، وتم إطلاقه لجميع عملاء AIVI-Learning في 8 أبريل. بعد الدمج، تم دعم لوحات العدادات (gauges)، حيث يمكن الآن للروبوت رباعي الأرجل Spot أن يقوم بالمراقبة الذاتية للمرافق الصناعية وقراءة بيانات الأدوات مثل عدادات الضغط. تقول Boston Dynamics إن بفضل قدرات الاستنتاج في Gemini، تحسنت أداءات ودقة المهام الأساسية مثل التفتيش البصري، عد الأطباق، واكتشاف السوائل. وتقول DeepMind إن ER 1.6 هو "أكثر نماذج الروبوتات أمانًا" التي طورتها، حيث تفوقت بشكل كبير على ER 1.5 في مهام الاستنتاج الفضائي المقاوم للتحديات. وفي اختبارات تحديد مخاطر السلامة استنادًا إلى تقارير الإصابات الحقيقية، سجلت نماذج ER نسبة أعلى بنسبة 6% في سيناريوهات النصوص، و10% في سيناريوهات الفيديو مقارنة بـ Gemini 3.0 Flash. (المصدر: BlockBeats)
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت