أخبار ME، في 14 أبريل (بتوقيت UTC+8)، وفقًا لمراقبة 1M AI News، أطلقت شركة جوجل DeepMind نموذج Gemini Robotics-ER 1.6، المصمم للتفكير العميق على مستوى عالٍ للروبوتات، مع تحسينات ملحوظة في الاستنتاج المكاني والفهم متعدد الزوايا مقارنة بالإصدارات السابقة ER 1.5 و Gemini 3.0 Flash. النموذج متاح الآن للمطورين عبر واجهة برمجة التطبيقات Gemini و Google AI Studio. تشمل الترقيات الأساسية ثلاث قدرات:

دقة التوجيه (pointing) المحسنة: يمكن استخدامها للكشف الدقيق عن الأجسام، العد، الاستنتاج حول العلاقات المكانية (مثل «حدد جميع الأجسام التي يمكن وضعها في الكوب الأزرق») وتخطيط مسارات الحركة، مع القدرة على رفض الأجسام غير الموجودة في الصورة بشكل صحيح.
الكشف الناجح من زوايا متعددة: يمكن للروبوت الآن دمج صور من عدة كاميرات لتحديد ما إذا كانت المهمة قد أُنجزت، مع الحفاظ على الدقة حتى في حالات التعتيم أو البيئة الديناميكية.
القدرة الجديدة على قراءة الأدوات: يمكنها تفسير العديد من الأدوات الصناعية مثل مقياس الضغط الدائري، مؤشرات مستوى السائل العمودية، والشاشات الرقمية، من خلال الرؤية الذكية (الاستنتاج البصري + تنفيذ الكود) لتحقيق استنتاج تدريجي، حيث يتم تكبير المنطقة التفصيلية أولاً، ثم حساب النسب والفواصل عبر التوجيه والحسابات البرمجية، وأخيرًا استنتاج القراءة باستخدام المعرفة العالمية. تستمد قدرة قراءة الأدوات من تعاون DeepMind مع شركة Boston Dynamics. أعلنت Boston Dynamics في نفس اليوم أنها دمجت Gemini و Gemini Robotics-ER 1.6 في منتجها Orbit AIVI-Learning، والذي تم إطلاقه لجميع عملاء AIVI-Learning في 8 أبريل. بعد الدمج، أُضيف دعم لعدادات الأدوات (gauges)، حيث يمكن الآن للروبوت الرباعي الأرجل Spot أن يقوم بالمراقبة الذاتية للمرافق الصناعية وقراءة بيانات الأدوات مثل مقياس الضغط. وذكرت Boston Dynamics أن بفضل قدرات الاستنتاج في Gemini، تحسنت أداءات AIVI-Learning الأساسية ودقته في المهام مثل التفتيش البصري، عد الأطباق، واكتشاف السوائل. وتقول DeepMind إن ER 1.6 هو «أكثر نماذج الروبوتات أمانًا لديها». في مهام الاستنتاج المكاني العدائية، تفوق بشكل كبير على ER 1.5 في الالتزام بالتعليمات الأمنية. وفي اختبارات تحديد مخاطر السلامة استنادًا إلى تقارير الإصابات الحقيقية، سجلت نماذج ER نسبة أعلى بمقدار 6% في سيناريوهات النصوص، و10% في سيناريوهات الفيديو مقارنة بـ Gemini 3.0 Flash. (المصدر: BlockBeats)

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

أعجبني
إعجاب
تعليق
إعادة النشر
مشاركة

تعليق

إضافة تعليق

لا توجد تعليقات

المواضيع الرائجة
عرض المزيد
#
WCTCTradingChallengeShare8MUSDT
670.27K درجة الشعبية
#
GateMarchTransparencyReport
30.46K درجة الشعبية
#
IsraelStrikesIranBTCPlunges
29.67K درجة الشعبية
#
GoldmanSachsFilesBitcoinIncomeETF
766.55K درجة الشعبية
#
USBlocksStraitofHormuz
739.12K درجة الشعبية

تثبيت

خريطة الموقع

أطلقت جوجل ديب مايند جيميني روبوتيكس-إر 1.6، وقد أصبح روبوت سبوت قادرًا على قراءة لوحات العدادات تلقائيًا

المواضيع الرائجة

WCTCTradingChallengeShare8MUSDT

GateMarchTransparencyReport

IsraelStrikesIranBTCPlunges

GoldmanSachsFilesBitcoinIncomeETF

USBlocksStraitofHormuz

تثبيت