جوجل ديب مايند تطلق TIPSv2، مشفر أساسي للتصور المكاني مع تصور فضائي ونصوص

أخبار ME، 15 أبريل (بتوقيت UTC+8)، أصدرت Google DeepMind مؤخرًا في مؤتمر CVPR 2026 نموذج TIPSv2، وهو مشفر أساسي للصور والنصوص يمتلك قدرة على الإدراك المكاني. حقق هذا النموذج نتائج قوية في الأداء العام، وحقق تحسينات ملحوظة في مهمة محاذاة كتل الصور والنصوص. يعتقد المعلن أن الذكاء الاصطناعي متعدد الوسائط الحقيقي يحتاج إلى فهم العلاقات المكانية في العالم. (المصدر: InFoQ)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت