جوجل ديب مايند تطلق جيميني روبوتيكس-إر 1.6، روبوت سبوت قادر الآن على قراءة لوحة العدادات تلقائيًا

robot
إنشاء الملخص قيد التقدم

أخبار ME، في 14 أبريل (بتوقيت UTC+8)، وفقًا لمراقبة 1M AI News، أطلقت شركة جوجل DeepMind نموذج Gemini Robotics-ER 1.6، المصمم لتمثيل نموذج استنتاج عالي المستوى للروبوتات، مع تحسينات ملحوظة في الاستنتاج المكاني والفهم متعدد الزوايا مقارنة بالإصدارات السابقة ER 1.5 و Gemini 3.0 Flash. النموذج متاح الآن للمطورين عبر واجهة برمجة التطبيقات Gemini و Google AI Studio. تشمل الترقيات الأساسية ثلاث قدرات: 1. تحسين دقة التوجيه (pointing): يمكن استخدامها للكشف الدقيق عن الأجسام، العد، الاستنتاج حول العلاقات المكانية (مثل «حدد جميع الأجسام التي يمكن وضعها في الكوب الأزرق») وتخطيط مسارات الحركة، مع القدرة على رفض التوجيه الصحيح للأجسام غير الموجودة في الصورة 2. الكشف الناجح من زوايا متعددة: يمكن للروبوت الآن دمج صور من كاميرات متعددة لتحديد ما إذا كانت المهمة قد اكتملت، مع الحفاظ على الدقة حتى في حالات التعتيم أو البيئة الديناميكية 3. القدرة الجديدة على قراءة الأدوات: يمكنها تفسير مقاييس الضغط الدائرية، مؤشرات مستوى السائل الرأسية، والشاشات الرقمية، من خلال الرؤية الوكيلية (الاستنتاج البصري + تنفيذ الكود) لتحقيق استنتاج تدريجي، حيث يتم تكبير المنطقة التفصيلية أولاً، ثم استخدام التوجيه والحسابات البرمجية لقياس النسب والفواصل، وأخيرًا دمج المعرفة العالمية للوصول إلى القراءة. تعتمد قدرة قراءة الأدوات على التعاون بين DeepMind و Boston Dynamics. أعلنت Boston Dynamics في نفس اليوم أنها دمجت Gemini و Gemini Robotics-ER 1.6 في منتجها Orbit AIVI-Learning، وتم إطلاقه لجميع عملاء AIVI-Learning في 8 أبريل. بعد الدمج، تم دعم لوحات القياس (gauges)، حيث يمكن الآن للروبوت رباعي الأرجل Spot أن يقوم بالمراقبة الذاتية في المنشآت الصناعية وقراءة بيانات الأدوات مثل مقاييس الضغط. وذكرت Boston Dynamics أن بفضل قدرات الاستنتاج لـ Gemini، شهد أداء AIVI-Learning ودقته في المهام مثل التفتيش البصري، عد الأطباق، واكتشاف السوائل، تحسنًا في الأداء الأساسي. وتقول DeepMind إن ER 1.6 هو «أكثر نماذج الروبوتات أمانًا لديها». في مهام الاستنتاج المكاني التحدي، تفوق بشكل كبير على ER 1.5 من حيث الالتزام بالتعليمات الأمنية. وفي اختبارات تحديد مخاطر السلامة استنادًا إلى تقارير الإصابات الحقيقية، سجلت نماذج ER نسبة أعلى بنسبة 6% في سيناريوهات النصوص و10% في سيناريوهات الفيديو مقارنة بـ Gemini 3.0 Flash. (المصدر: BlockBeats)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت