أخبار ME News، 14 أبريل (بتوقيت UTC+8)، وفقًا لمراقبة 1M AI News، أطلقت شركة جوجل DeepMind نموذج Gemini Robotics-ER 1.6، المصمم كنموذج استنتاج عالي المستوى للروبوتات، والذي يُظهر تحسينات ملحوظة مقارنة بالإصدارات السابقة ER 1.5 و Gemini 3.0 Flash في الاستنتاج المكاني والفهم متعدد الزوايا. النموذج متاح الآن للمطورين عبر واجهة برمجة التطبيقات Gemini و Google AI Studio. تشمل الترقيات الأساسية ثلاث قدرات: 1. تحسين دقة التوجيه (pointing): يمكن استخدامها للكشف الدقيق عن الأجسام، العد، الاستنتاج حول العلاقات المكانية (مثل «حدد جميع الأجسام التي يمكن وضعها في الكوب الأزرق») وتخطيط مسارات الحركة، مع القدرة على رفض التوجيه الصحيح للأجسام غير الموجودة في الصورة 2. نجاح الكشف متعدد الزوايا: يمكن للروبوت الآن دمج صور من عدة كاميرات لتحديد ما إذا كانت المهمة قد أُنجزت، مع الحفاظ على الدقة حتى في حالات التعتيم أو البيئة الديناميكية 3. القدرة الجديدة على قراءة الأدوات: يمكنها تفسير أدوات صناعية متعددة مثل مقياس الضغط الدائري، مؤشرات مستوى السائل العمودية، وشاشات العرض الرقمية، من خلال الرؤية الوكيلة (visual reasoning + code execution) لتحقيق استنتاج تدريجي، حيث يتم تكبير المنطقة التفصيلية أولاً، ثم استخدام التوجيه والحسابات البرمجية لقياس النسب والفواصل، وأخيرًا دمج المعرفة العالمية للوصول إلى القراءة. تعتمد قدرة قراءة الأدوات على التعاون بين DeepMind و Boston Dynamics. أعلنت Boston Dynamics في نفس اليوم أنها دمجت Gemini و Gemini Robotics-ER 1.6 في منتجها Orbit AIVI-Learning، والذي تم إطلاقه لجميع عملاء AIVI-Learning في 8 أبريل. بعد الدمج، أُضيف دعم لوحدة القياس (gauges)، حيث يمكن الآن للروبوت رباعي الأرجل Spot أن يقوم بالمراقبة الذاتية للمرافق الصناعية وقراءة بيانات الأدوات مثل مقياس الضغط. وذكرت Boston Dynamics أن بفضل قدرات الاستنتاج لـ Gemini، شهدت أداء AIVI-Learning الأساسي ودقته في مهام مثل التفتيش البصري، وعد الأطباق، والكشف عن السوائل، تحسنًا أيضًا. وتقول DeepMind إن ER 1.6 هو «أكثر نماذج الروبوتات أمانًا لديها». في مهام الاستنتاج المكاني المقاوم للهجمات، تفوق بشكل كبير على ER 1.5 من حيث الالتزام بالتعليمات الأمنية. وفي اختبارات تحديد مخاطر السلامة استنادًا إلى تقارير الإصابات الحقيقية، كانت نماذج ER أعلى بنسبة 6% في سيناريوهات النصوص، و10% في سيناريوهات الفيديو مقارنة بـ Gemini 3.0 Flash. (المصدر: BlockBeats)

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

أعجبني
إعجاب
تعليق
إعادة النشر
مشاركة

تعليق

إضافة تعليق

لا توجد تعليقات

المواضيع الرائجة
عرض المزيد
#
WCTCTradingKingPK
534.29K درجة الشعبية
#
USSeeksStrategicBitcoinReserve
58.75M درجة الشعبية
#
IsraelStrikesIranBTCPlunges
39.51K درجة الشعبية
#
BitcoinETFOptionLimitQuadruples
1.02M درجة الشعبية
#
#FedHoldsRateButDividesDeepen
42.48K درجة الشعبية

تثبيت

خريطة الموقع

جوجل ديب مايند تطلق جيميني روبوتيكس-إر 1.6، روبوت سبوت قادر الآن على قراءة اللوحات تلقائيًا

المواضيع الرائجة

WCTCTradingKingPK

USSeeksStrategicBitcoinReserve

IsraelStrikesIranBTCPlunges

BitcoinETFOptionLimitQuadruples

#FedHoldsRateButDividesDeepen

تثبيت