أطلقت جوجل ديب مايند جيميني روبوتيكس-إر 1.6، وقد أصبح روبوت سبوت قادرًا على قراءة لوحات العدادات تلقائيًا

robot
إنشاء الملخص قيد التقدم

أخبار ME، في 14 أبريل (بتوقيت UTC+8)، وفقًا لمراقبة 1M AI News، أطلقت شركة جوجل DeepMind نموذج Gemini Robotics-ER 1.6، المصمم للتفكير العميق على مستوى عالٍ للروبوتات، مع تحسينات ملحوظة في الاستنتاج المكاني والفهم متعدد الزوايا مقارنة بالإصدارات السابقة ER 1.5 و Gemini 3.0 Flash. النموذج متاح الآن للمطورين عبر واجهة برمجة التطبيقات Gemini و Google AI Studio. تشمل الترقيات الأساسية ثلاث قدرات:

  1. دقة التوجيه (pointing) المحسنة: يمكن استخدامها للكشف الدقيق عن الأجسام، العد، الاستنتاج حول العلاقات المكانية (مثل «حدد جميع الأجسام التي يمكن وضعها في الكوب الأزرق») وتخطيط مسارات الحركة، مع القدرة على رفض الأجسام غير الموجودة في الصورة بشكل صحيح.
  2. الكشف الناجح من زوايا متعددة: يمكن للروبوت الآن دمج صور من عدة كاميرات لتحديد ما إذا كانت المهمة قد أُنجزت، مع الحفاظ على الدقة حتى في حالات التعتيم أو البيئة الديناميكية.
  3. القدرة الجديدة على قراءة الأدوات: يمكنها تفسير العديد من الأدوات الصناعية مثل مقياس الضغط الدائري، مؤشرات مستوى السائل العمودية، والشاشات الرقمية، من خلال الرؤية الذكية (الاستنتاج البصري + تنفيذ الكود) لتحقيق استنتاج تدريجي، حيث يتم تكبير المنطقة التفصيلية أولاً، ثم حساب النسب والفواصل عبر التوجيه والحسابات البرمجية، وأخيرًا استنتاج القراءة باستخدام المعرفة العالمية. تستمد قدرة قراءة الأدوات من تعاون DeepMind مع شركة Boston Dynamics. أعلنت Boston Dynamics في نفس اليوم أنها دمجت Gemini و Gemini Robotics-ER 1.6 في منتجها Orbit AIVI-Learning، والذي تم إطلاقه لجميع عملاء AIVI-Learning في 8 أبريل. بعد الدمج، أُضيف دعم لعدادات الأدوات (gauges)، حيث يمكن الآن للروبوت الرباعي الأرجل Spot أن يقوم بالمراقبة الذاتية للمرافق الصناعية وقراءة بيانات الأدوات مثل مقياس الضغط. وذكرت Boston Dynamics أن بفضل قدرات الاستنتاج في Gemini، تحسنت أداءات AIVI-Learning الأساسية ودقته في المهام مثل التفتيش البصري، عد الأطباق، واكتشاف السوائل. وتقول DeepMind إن ER 1.6 هو «أكثر نماذج الروبوتات أمانًا لديها». في مهام الاستنتاج المكاني العدائية، تفوق بشكل كبير على ER 1.5 في الالتزام بالتعليمات الأمنية. وفي اختبارات تحديد مخاطر السلامة استنادًا إلى تقارير الإصابات الحقيقية، سجلت نماذج ER نسبة أعلى بمقدار 6% في سيناريوهات النصوص، و10% في سيناريوهات الفيديو مقارنة بـ Gemini 3.0 Flash. (المصدر: BlockBeats)
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت