أخبار ME News، في 14 أبريل (بتوقيت UTC+8)، وفقًا لمراقبة 1M AI News، أطلقت شركة جوجل DeepMind نموذج Gemini Robotics-ER 1.6، المصنف كنموذج استنتاج عالي المستوى للروبوتات، والذي يُظهر تحسينات ملحوظة مقارنة بالإصدارات السابقة ER 1.5 و Gemini 3.0 Flash في الاستنتاج المكاني والفهم متعدد الزوايا. النموذج متاح الآن للمطورين عبر واجهة برمجة التطبيقات Gemini و Google AI Studio. تشمل الترقيات الأساسية ثلاث قدرات: 1. تحسين دقة التوجيه (pointing): يمكن استخدامه للكشف الدقيق عن الأجسام، العد، الاستنتاج حول العلاقات المكانية (مثل «حدد جميع الأجسام التي يمكن وضعها في الكوب الأزرق») وتخطيط مسارات الحركة، مع القدرة على رفض التوجيه الصحيح للأجسام غير الموجودة في الصورة 2. الكشف الناجح من زوايا متعددة: يمكن للروبوت الآن دمج صور من عدة كاميرات لتحديد ما إذا كانت المهمة قد أُنجزت، مع الحفاظ على الدقة حتى في حالات التعتيم أو البيئة الديناميكية 3. إضافة قدرة قراءة الأدوات: يمكنه تفسير أدوات صناعية متنوعة مثل مقياس الضغط الدائري، مؤشرات مستوى السائل العمودية، وشاشات العرض الرقمية، من خلال الرؤية الوكيلة (visual reasoning + code execution) لتحقيق استنتاج تدريجي، حيث يتم تكبير المنطقة التفصيلية أولاً، ثم استخدام التوجيه والحسابات البرمجية لقياس النسب والفواصل، وأخيرًا دمج المعرفة العالمية للوصول إلى القراءة. تعتمد قدرة قراءة الأدوات على التعاون بين DeepMind و Boston Dynamics. أعلنت Boston Dynamics في نفس اليوم أنها دمجت Gemini و Gemini Robotics-ER 1.6 في منتجها Orbit AIVI-Learning، والذي تم إطلاقه لجميع عملاء AIVI-Learning في 8 أبريل. بعد الدمج، أُضيف دعم لوحدة القياس (gauges)، حيث يمكن الآن للروبوت رباعي الأرجل Spot إجراء جولات تفتيش ذاتية في المنشآت الصناعية وقراءة بيانات الأدوات مثل مقياس الضغط. وذكرت Boston Dynamics أن بفضل قدرات الاستنتاج لنموذج Gemini، شهدت أداء AIVI-Learning وتحسين دقته في المهام القائمة على التفتيش البصري، وعدّ الأطباق، والكشف عن السوائل، ارتفاعًا ملحوظًا. وتقول DeepMind إن ER 1.6 هو «أكثر نماذج الروبوتات أمانًا لديها». في مهام الاستنتاج المكاني المقاوم للهجمات، تفوق بشكل كبير على ER 1.5 من حيث الالتزام بالتعليمات الأمنية. وفي اختبارات تحديد مخاطر السلامة استنادًا إلى تقارير الإصابات الحقيقية، كانت نماذج ER أعلى بنسبة 6% في سيناريوهات النص، و10% في سيناريوهات الفيديو مقارنة بـ Gemini 3.0 Flash. (المصدر: BlockBeats)

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

أعجبني
إعجاب
تعليق
إعادة النشر
مشاركة

تعليق

إضافة تعليق

لا توجد تعليقات

المواضيع الرائجة
عرض المزيد
#
WCTCTradingKingPK
536.95K درجة الشعبية
#
USSeeksStrategicBitcoinReserve
58.75M درجة الشعبية
#
IsraelStrikesIranBTCPlunges
39.51K درجة الشعبية
#
BitcoinETFOptionLimitQuadruples
1.02M درجة الشعبية
#
#FedHoldsRateButDividesDeepen
42.73K درجة الشعبية

تثبيت

خريطة الموقع

جوجل ديب مايند تطلق جيميني روبوتيكس-إر 1.6، روبوت سبوت قادر الآن على قراءة لوحة العدادات تلقائيًا

المواضيع الرائجة

WCTCTradingKingPK

USSeeksStrategicBitcoinReserve

IsraelStrikesIranBTCPlunges

BitcoinETFOptionLimitQuadruples

#FedHoldsRateButDividesDeepen

تثبيت