أطلقت شركة DeepMind التابعة لجوجل نموذج Gemini Robotics-ER 1.6، مع تعزيز كبير في قدرات الاستنتاج العالي المستوى، مما حسّن دقة التوجيه، والكشف متعدد الزوايا، وقراءة الأدوات. أصبح هذا النموذج متاحًا للمطورين عبر واجهة برمجة التطبيقات Gemini، وتم دمجه مع نظام Orbit AIVI-Learning من شركة Boston Dynamics، ليقوم بالفحص الذاتي في السيناريوهات الصناعية، مما يعزز السلامة ودقة المهام.

MeNews

2026-05-03 11:53:33

إنشاء الملخص قيد التقدم

أخبار ME، في 14 أبريل (بتوقيت UTC+8)، وفقًا لمراقبة 1M AI News، أطلقت شركة جوجل DeepMind نموذج Gemini Robotics-ER 1.6، المصمم لتمثيل نموذج استنتاج عالي المستوى للروبوتات، مع تحسينات ملحوظة في الاستنتاج المكاني والفهم متعدد الزوايا مقارنة بالإصدارات السابقة ER 1.5 و Gemini 3.0 Flash. النموذج متاح الآن للمطورين عبر واجهة برمجة التطبيقات Gemini و Google AI Studio. تشمل الترقيات الأساسية ثلاث قدرات: 1. تحسين دقة التوجيه (pointing): يمكن استخدامها للكشف الدقيق عن الأجسام، العد، الاستنتاج حول العلاقات المكانية (مثل «حدد جميع الأجسام التي يمكن وضعها في الكوب الأزرق») وتخطيط مسارات الحركة، مع القدرة على رفض التوجيه الصحيح للأجسام غير الموجودة في الصورة 2. الكشف الناجح من زوايا متعددة: يمكن للروبوت الآن دمج صور من كاميرات متعددة لتحديد ما إذا كانت المهمة قد اكتملت، مع الحفاظ على الدقة حتى في حالات التعتيم أو البيئة الديناميكية 3. القدرة الجديدة على قراءة الأدوات: يمكنها تفسير مقاييس الضغط الدائرية، مؤشرات مستوى السائل الرأسية، والشاشات الرقمية، من خلال الرؤية الوكيلية (الاستنتاج البصري + تنفيذ الكود) لتحقيق استنتاج تدريجي، حيث يتم تكبير المنطقة التفصيلية أولاً، ثم استخدام التوجيه والحسابات البرمجية لقياس النسب والفواصل، وأخيرًا دمج المعرفة العالمية للوصول إلى القراءة. تعتمد قدرة قراءة الأدوات على التعاون بين DeepMind و Boston Dynamics. أعلنت Boston Dynamics في نفس اليوم أنها دمجت Gemini و Gemini Robotics-ER 1.6 في منتجها Orbit AIVI-Learning، وتم إطلاقه لجميع عملاء AIVI-Learning في 8 أبريل. بعد الدمج، تم دعم لوحات القياس (gauges)، حيث يمكن الآن للروبوت رباعي الأرجل Spot أن يقوم بالمراقبة الذاتية في المنشآت الصناعية وقراءة بيانات الأدوات مثل مقاييس الضغط. وذكرت Boston Dynamics أن بفضل قدرات الاستنتاج لـ Gemini، شهد أداء AIVI-Learning ودقته في المهام مثل التفتيش البصري، عد الأطباق، واكتشاف السوائل، تحسنًا في الأداء الأساسي. وتقول DeepMind إن ER 1.6 هو «أكثر نماذج الروبوتات أمانًا لديها». في مهام الاستنتاج المكاني التحدي، تفوق بشكل كبير على ER 1.5 من حيث الالتزام بالتعليمات الأمنية. وفي اختبارات تحديد مخاطر السلامة استنادًا إلى تقارير الإصابات الحقيقية، سجلت نماذج ER نسبة أعلى بنسبة 6% في سيناريوهات النصوص و10% في سيناريوهات الفيديو مقارنة بـ Gemini 3.0 Flash. (المصدر: BlockBeats)

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

أعجبني
إعجاب
تعليق
إعادة النشر
مشاركة

تعليق

إضافة تعليق

لا توجد تعليقات

المواضيع الرائجة
عرض المزيد
#
WCTCTradingKingPK
554.13K درجة الشعبية
#
USSeeksStrategicBitcoinReserve
58.77M درجة الشعبية
#
IsraelStrikesIranBTCPlunges
39.77K درجة الشعبية
#
BitcoinETFOptionLimitQuadruples
1.03M درجة الشعبية
#
#FedHoldsRateButDividesDeepen
43.84K درجة الشعبية

تثبيت

خريطة الموقع

جوجل ديب مايند تطلق جيميني روبوتيكس-إر 1.6، روبوت سبوت قادر الآن على قراءة لوحة العدادات تلقائيًا

المواضيع الرائجة

WCTCTradingKingPK

USSeeksStrategicBitcoinReserve

IsraelStrikesIranBTCPlunges

BitcoinETFOptionLimitQuadruples

#FedHoldsRateButDividesDeepen

تثبيت