مؤشر أكثر ذكاءً: رؤية جوجل ديب مايند المعتمدة على جيميني لالحوسبة المدركة للنوايا تبدأ في التبلور | منشور الميتافيرس

باختصار

تستكشف شركة جوجل ديب مايند المدعومة بالذكاء الاصطناعي نظام مؤشر يستخدم جيميني لجعل التفاعل مع الشاشة أكثر بديهية، ووعيًا بالسياق، ومتصلًا عبر التطبيقات وسير العمل.

A Smarter Cursor: Google DeepMind’s Gemini-Powered Vision For Intent-Aware Computing Begins To Take Shapeشركة جوجل ديب مايند، التابعة لجوجل، أطلقت أبحاثًا تجريبية تستكشف شكلاً معاد تصميمه للتفاعل مع الحاسوب يعيد التفكير في مؤشر الفأرة التقليدي، وهو عنصر أساسي في واجهات المستخدم الرسومية المستخدمة منذ عقود. يركز المبادرة على دمج قدرات الذكاء الاصطناعي، وتحديدًا نموذج جيميني، في التفاعلات المعتمدة على المؤشر لخلق تجربة حوسبة أكثر وعيًا بالسياق وبديهية.

وفقًا للشركة، ظل مؤشر الفأرة دون تغيير إلى حد كبير لأكثر من خمسين عامًا على الرغم من التحولات الكبرى في نماذج الحوسبة. تقول فريق البحث إن الهدف هو تطوير المؤشر ليصبح أكثر من أداة تنقل بسيطة بحيث يمكنه تفسير ليس فقط ما يشير إليه، بل أيضًا استنتاج نية المستخدم. يُقصد من هذا النهج تقليل الحاجة إلى تنقل المستخدم بين التطبيقات أو تقديم مطالب نصية مفصلة في واجهات ذكاء اصطناعي منفصلة.

تحت المفهوم المقترح، يتم دمج وظيفة الذكاء الاصطناعي مباشرة في سير عمل المستخدم، مما يسمح بحدوث التفاعلات داخل التطبيقات الحالية بدلاً من الحاجة إلى نوافذ ذكاء اصطناعي مخصصة. كمثال، يمكن للمستخدم أن يشير إلى مبنى على خريطة ويطلب الاتجاهات عبر إدخال صوتي أو اختصار طبيعي، مع استخدام النظام للفهم السياقي لمعالجة الطلب بدون تعليمات إضافية.

توضح الأبحاث مجموعة من مبادئ التفاعل المقصودة لتقليل الاحتكاك بين نية المستخدم واستجابة النظام. أحد المبادئ، الموصوف بأنه الحفاظ على استمرارية سير العمل، يؤكد على أن أدوات الذكاء الاصطناعي يجب أن تعمل عبر التطبيقات دون إجبار المستخدمين على بيئات منفصلة. ضمن هذا النموذج، يمكن إكمال مهام مثل تلخيص مستند، تحويل التصورات البصرية للبيانات، أو تعديل المحتوى مباشرة من خلال إجراءات تعتمد على المؤشر.

مبدأ آخر يركز على التقاط السياق، حيث يفسر النظام ليس فقط العنصر المحدد ولكن أيضًا معناه المحيط. بدلاً من الحاجة إلى تعليمات نصية دقيقة، سيحدد نظام الذكاء الاصطناعي عناصر ذات صلة مثل الفقرات، الصور، أو أجزاء الشفرة استنادًا إلى مكان توجيه المؤشر، مما يتيح استجابات أكثر فورية واستهدافًا.

مفهوم آخر يسلط الضوء على استخدام أنماط التواصل البشري الطبيعي، حيث يتم دمج الإيماءات والعبارات القصيرة مثل “هذا” أو “ذلك” مع فهم سياقي. يهدف هذا النهج إلى محاكاة أساليب التفاعل في العالم الحقيقي، وتقليل الاعتماد على المطالب المنظمة، وتمكين تواصل أكثر سلاسة مع أنظمة الذكاء الاصطناعي.

جوجل ديب مايند تستكشف واجهات تعتمد على الذكاء الاصطناعي تحول العناصر المرئية على الشاشة إلى كيانات رقمية قابلة للتنفيذ

كما تقدم الأبحاث فكرة تحويل العناصر البصرية على الشاشة إلى كائنات رقمية قابلة للتنفيذ. في هذا الإطار، يتم تفسير البكسلات ككيانات منظمة مثل المواقع، المهام، أو العناصر ذات الاهتمام. على سبيل المثال، يمكن تحويل صورة إلى قائمة من الإجراءات، أو يمكن استخدام إطار فيديو متوقف لاستخراج معلومات ذات صلة من العالم الحقيقي مثل تفاصيل المطاعم.

أشارت الشركة إلى أن هذه المفاهيم التجريبية يتم دمجها في استكشافات المنتجات المبكرة، بما في ذلك تجارب تعتمد على المتصفح في كروم ونماذج أولية لواجهات الأجهزة. في هذه التطبيقات، سيتمكن المستخدمون من التفاعل مع المساعدة الذكية مباشرة من خلال إجراءات التوجيه، مثل مقارنة العناصر المختارة على صفحة ويب أو تصور الكائنات داخل بيئة مادية. كما يتم اختبار ميزات تجريبية إضافية على منصات أخرى، مما يعكس استمرار استكشاف تصميم واجهات المستخدم المدمجة مع الذكاء الاصطناعي.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت