الوكيل متعدد الوسائط العام في عمليات الفضاء الدلالي، يبدو متقدمًا، لكن التأخير العالي يجعله بلا فائدة.

شاهد النسخة الأصلية
MeNews
فريق NUS يصدر معيار GameWorld، ويقيم وكلاء الذكاء الاصطناعي متعدد الأوضاع في 34 لعبة متصفح
فريق NUS أصدر معيار GameWorld، والذي يتضمن 34 لعبة متصفح و170 مهمة، مع مؤشرات قابلة للتحقق لتحقيق تقييم موضوعي. اختبار نوعين من واجهات الوكيل: واجهة استخدام الكمبيوتر المباشرة التي تتطلب أوامر لوحة المفاتيح والماوس، ووكيل متعدد الوسائط العام الذي يعمل في مساحة دلالية. أظهرت التجارب على 18 مجموعة من النماذج-الواجهات أن حتى الأفضل أداءً لا يقترب من أداء البشر، وأن هناك تحديات في التأخير الزمني في الوقت الحقيقي، وحساسية ذاكرة السياق، وفعالية الحركات. الورقة البحثية ذات الصلة والكود متاحان على HuggingFace وGitHub.
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت