مؤخرًا، أطلق فريق معالجة اللغات الطبيعية بجامعة فودان (FudanNLP) ورقة مراجعة حول الوكلاء المعتمدين على LLM. يبلغ طول النص الكامل 86 صفحة ويحتوي على أكثر من 600 مرجع! بدءًا من تاريخ وكلاء الذكاء الاصطناعي، قام المؤلفون بتصنيف الوضع الحالي للعملاء الأذكياء بشكل شامل استنادًا إلى نماذج لغوية كبيرة، بما في ذلك: الخلفية، والتكوين، وسيناريوهات تطبيق الوكلاء المعتمدين على LLM، ومجتمع الوكلاء الذي نوقش كثيرًا**. في الوقت نفسه، ناقش المؤلفون القضايا التطلعية والمفتوحة المتعلقة بالوكيل، والتي لها قيمة كبيرة لاتجاهات التطوير المستقبلية في المجالات ذات الصلة.

* رابط الورق:

القائمة الورقية للوكلاء المعتمدين على LLM:

**سيضيف أعضاء الفريق أيضًا “ملخصًا من جملة واحدة” إلى كل ورقة ذات صلة، مرحبًا بك في مستودع Star. **

خلفية البحث

لفترة طويلة، كان الباحثون يتابعون الذكاء العام الاصطناعي (AGI) الذي يعادل المستويات البشرية أو حتى يتجاوزها. في وقت مبكر من الخمسينيات، قام آلان تورينج بتوسيع مفهوم “الذكاء” ليشمل الكيانات الاصطناعية واقترح اختبار تورينج الشهير. غالبًا ما تسمى كيانات الذكاء الاصطناعي هذه بالوكلاء. ينشأ مفهوم “الوكيل” من الفلسفة ويصف كيانًا لديه رغبات ومعتقدات ونوايا وقدرة على اتخاذ الإجراءات. وفي مجال الذكاء الاصطناعي، أُعطي هذا المصطلح معنى جديدًا: كيانات ذكية تتميز بخصائص الاستقلالية والتفاعلية والإيجابية والتواصل الاجتماعي.

**لا يوجد إجماع على الترجمة الصينية لمصطلح “وكيل”، حيث يترجمها بعض العلماء على أنها وكيل أو فاعل أو وكيل أو وكيل ذكي. ويشير كل من “الوكيل” و"الوكيل الذكي" اللذين يظهران في هذه المقالة إلى الوكيل. *

منذ ذلك الحين، أصبح تصميم العملاء محور اهتمام مجتمع الذكاء الاصطناعي. ومع ذلك، ركز العمل السابق بشكل أساسي على تعزيز قدرات محددة للعملاء، مثل التفكير الرمزي أو إتقان مهام محددة (الشطرنج، Go، وما إلى ذلك). تركز هذه الدراسات بشكل أكبر على تصميم الخوارزميات واستراتيجيات التدريب، مع تجاهل تطوير القدرات العامة الكامنة في النموذج، مثل ذاكرة المعرفة، والتخطيط طويل المدى، والتعميم الفعال، والتفاعل الفعال. لقد اتضح أن تعزيز القدرات المتأصلة في النموذج يعد عاملاً رئيسيًا في تعزيز التطوير الإضافي للوكلاء الأذكياء. **

إن ظهور نماذج لغوية كبيرة (LLMs) يجلب الأمل لمزيد من التطوير للوكلاء الأذكياء. إذا تم تقسيم مسار التطوير من البرمجة اللغوية العصبية إلى الذكاء الاصطناعي العام (AGI) إلى خمسة مستويات: المتن، والإنترنت، والإدراك، والتجسيد، والسمات الاجتماعية، فإن نموذج اللغة الحالي واسع النطاق قد وصل إلى المستوى الثاني، مع إدخال وإخراج النص على نطاق الإنترنت. على هذا الأساس، إذا تم منح الوكلاء المعتمدين على LLM مساحة للإدراك ومساحة للعمل، فسوف يصلون إلى المستويين الثالث والرابع. علاوة على ذلك، عندما يتفاعل العديد من الوكلاء ويتعاونون لحل مهام أكثر تعقيدًا، أو تعكس السلوكيات الاجتماعية في العالم الحقيقي، فإن لديهم القدرة على الوصول إلى المستوى الخامس - مجتمع الوكلاء.

* يتصور المؤلفون مجتمعًا متناغمًا من العناصر الذكية التي يمكن للبشر أيضًا المشاركة فيها. المشهد مأخوذ من مهرجان Sea Lantern في فيلم “Genshin Impact”. *

ولادة الوكيل

كيف سيبدو الوكيل الذكي المدعوم بنموذج كبير؟ مستوحاة من قانون “البقاء للأصلح” لداروين، اقترح المؤلفون إطارًا عامًا للوكلاء الأذكياء يعتمد على نماذج كبيرة. إذا أراد الإنسان البقاء في المجتمع، عليه أن يتعلم التكيف مع البيئة، لذلك يحتاج إلى قدرات معرفية وأن يكون قادراً على إدراك التغيرات في العالم الخارجي والاستجابة لها. وبالمثل، يتكون إطار الوكلاء الأذكياء أيضًا من ثلاثة أجزاء: **محطة التحكم (الدماغ)، ومحطة الإدراك (الإدراك)، ومحطة العمل (الفعل). **

محطة التحكم: تتكون عادةً من حاملي شهادات LLM، وهي جوهر العملاء الأذكياء. ولا يمكنه تخزين الذاكرة والمعرفة فحسب، بل يمكنه أيضًا القيام بوظائف لا غنى عنها مثل معالجة المعلومات واتخاذ القرار. يمكنه تقديم عملية التفكير والتخطيط، والتعامل مع المهام غير المعروفة بشكل جيد، مما يعكس التعميم وقابلية النقل للوكلاء الأذكياء.
نهاية الإدراك: قم بتوسيع مساحة الإدراك للوكيل الذكي من النص الخالص لتشمل مجالات متعددة الوسائط مثل النص والرؤية والسمع، حتى يتمكن الوكيل من الحصول على المعلومات من البيئة المحيطة واستخدامها بشكل أكثر فعالية.
محطة متنقلة: بالإضافة إلى إخراج النص العادي، يتم منح الوكيل أيضًا القدرة على التجسيد واستخدام الأدوات، حتى يتمكن من التكيف بشكل أفضل مع التغيرات البيئية، والتفاعل مع البيئة من خلال التعليقات، وحتى تشكيل بيئة.

يتكون الإطار المفاهيمي للوكيل القائم على LLM من ثلاثة مكونات: نهاية التحكم (الدماغ)، ونهاية الإدراك (الإدراك) ونهاية الإجراء (الإجراء).

يستخدم المؤلفون مثالاً لتوضيح سير عمل الوكيل المعتمد على LLM: عندما يسأل الإنسان ما إذا كان سيهطل المطر، تقوم نهاية الإدراك (الإدراك) بتحويل التعليمات إلى تمثيل يمكن أن يفهمه LLM. ثم تبدأ محطة التحكم (Brain) في التفكير والتخطيط للعمل بناءً على توقعات الطقس والطقس الحالية على الإنترنت. وأخيراً يستجيب الفعل ويسلم المظلة للإنسان.

من خلال تكرار العملية المذكورة أعلاه، يمكن للوكيل الذكي الحصول بشكل مستمر على ردود الفعل والتفاعل مع البيئة.

** محطة التحكم: الدماغ **

باعتباره المكون الأساسي للوكيل الذكي، يقدم المؤلفون قدراته من خمسة جوانب:

**التفاعل اللغوي الطبيعي: **اللغة هي وسيلة التواصل وتحتوي على معلومات غنية. بفضل القدرة القوية على توليد اللغة الطبيعية وإمكانيات الفهم التي يتمتع بها حاملو شهادة LLM، يمكن للوكلاء الأذكياء التفاعل مع العالم الخارجي لجولات متعددة من خلال اللغة الطبيعية لتحقيق أهدافهم. وعلى وجه التحديد، يمكن تقسيمها إلى جانبين:

إنشاء نص عالي الجودة: يُظهر عدد كبير من تجارب التقييم أن LLMs يمكنها إنشاء نص بطلاقة ومتنوع وجديد ويمكن التحكم فيه. على الرغم من ضعف الأداء في اللغات الفردية، إلا أن المهارات المتعددة اللغات جيدة بشكل عام.
فهم المغزى: بالإضافة إلى المحتوى الذي يتم التعبير عنه بشكل بديهي، قد تنقل اللغة أيضًا معلومات مثل نوايا المتحدث وتفضيلاته. والمغزى من ذلك هو أنها تساعد الوكلاء على التواصل والتعاون بشكل أكثر كفاءة، وقد أظهرت النماذج الكبيرة بالفعل الإمكانات المحتملة في هذا الصدد.

المعرفة: يتمتع طلاب ماجستير القانون الذين تم تدريبهم استنادًا إلى مجموعات كبيرة من النصوص بالقدرة على تخزين كميات هائلة من المعرفة. بالإضافة إلى المعرفة اللغوية، تعد معرفة الفطرة السليمة ومعرفة المهارات المهنية مكونات مهمة للوكلاء المعتمدين على LLM.

على الرغم من أن ماجستير إدارة الأعمال أنفسهم لا يزال لديهم مشاكل مثل المعرفة منتهية الصلاحية والهلوسة، إلا أن بعض الأبحاث الحالية يمكن أن تخفف منها إلى حد ما من خلال تحرير المعرفة أو استدعاء قواعد المعرفة الخارجية.

الذاكرة: في إطار هذه المقالة، تقوم وحدة الذاكرة (الذاكرة) بتخزين الملاحظات والأفكار وتسلسلات الإجراءات السابقة للوكيل. ومن خلال آليات ذاكرة محددة، يمكن للوكلاء التفكير بشكل فعال في الاستراتيجيات السابقة وتطبيقها، مما يسمح لهم بالاستفادة من تجارب الماضي للتكيف مع البيئات غير المألوفة.

هناك ثلاث طرق شائعة الاستخدام لتحسين قدرة الذاكرة:

تمديد حد الطول للبنية الأساسية: تحسين مشكلة حد طول التسلسل المتأصل في المحولات.
التلخيص: تلخيص الذاكرة لتعزيز قدرة الوكيل على استخراج التفاصيل الأساسية من الذاكرة.
الضغط: يمكن تحسين كفاءة استرجاع الذاكرة باستخدام المتجهات أو هياكل البيانات المناسبة لضغط الذاكرة.

بالإضافة إلى ذلك، تعد طريقة استرجاع الذاكرة مهمة أيضًا، ولا يمكن للوكيل الوصول إلى المعلومات الأكثر دقة ووثيقة الصلة إلا من خلال استرجاع المحتوى المناسب.

الاستدلال والتخطيط: تعد القدرة على الاستدلال (الاستدلال) أمرًا بالغ الأهمية للعملاء الأذكياء لأداء المهام المعقدة مثل اتخاذ القرار والتحليل. خاصة بـ LLMs، فهي عبارة عن سلسلة من أساليب التحفيز التي تمثلها سلسلة الفكر (CoT). التخطيط هو استراتيجية شائعة الاستخدام عند مواجهة تحديات كبيرة. فهو يساعد الوكلاء على تنظيم تفكيرهم وتحديد الأهداف وتحديد الخطوات اللازمة لتحقيق تلك الأهداف. في التنفيذ المحدد، يمكن أن يتضمن التخطيط خطوتين:

صياغة الخطة: يقوم الوكيل بتقسيم المهام المعقدة إلى مهام فرعية أكثر قابلية للإدارة. على سبيل المثال: التفكيك لمرة واحدة ثم التنفيذ بالتسلسل، والتخطيط والتنفيذ خطوة بخطوة، والتخطيط متعدد المسارات واختيار المسار الأمثل، وما إلى ذلك. في بعض السيناريوهات التي تتطلب معرفة احترافية، يمكن دمج الوكلاء مع وحدات Planner النمطية في مجالات محددة لتعزيز القدرات. *التفكير في الخطة: بعد وضع الخطة، يمكنك التفكير فيها وتقييم نقاط القوة والضعف فيها. يأتي هذا النوع من التفكير بشكل عام من ثلاثة جوانب: استخدام آليات التغذية الراجعة الداخلية، والحصول على ردود الفعل من التفاعل مع البشر، والحصول على ردود الفعل من البيئة.

** قابلية النقل والتعميم: ** يمنح حاملو ماجستير إدارة الأعمال الذين يتمتعون بالمعرفة العالمية الوكلاء الأذكياء بقدرات قوية على الترحيل والتعميم. الوكيل الجيد ليس قاعدة معرفية ثابتة، ولكنه يتمتع أيضًا بقدرات تعلم ديناميكية:

التعميم على المهام غير المعروفة: مع زيادة حجم النموذج وبيانات التدريب، طورت LLMs قدرات مذهلة في حل المهام غير المعروفة. كان أداء النموذج الكبير الذي تم ضبطه بدقة من خلال التعليمات جيدًا في اختبار اللقطة الصفرية، وحقق نتائج جيدة مثل النماذج المتخصصة في العديد من المهام.
التعلم في السياق: النماذج الكبيرة ليست فقط قادرة على التعلم عن طريق القياس من عدد صغير من الأمثلة في السياق، ولكن يمكن أيضًا توسيع هذه القدرة لتشمل مشاهد متعددة الوسائط خارج النص، مما يوفر المزيد من الفرص للوكلاء للتقدم في العالم الحقيقي.احتمالات كثيرة. *التعلم المستمر: التحدي الرئيسي للتعلم المستمر هو النسيان الكارثي، أي أنه عندما يتعلم النموذج مهمة جديدة، فإنه يفقد المعرفة بسهولة في المهام السابقة. يجب على العملاء الأذكياء في المجالات المتخصصة أن يحاولوا تجنب فقدان المعرفة في المجالات العامة.

نهاية الإدراك: الإدراك

ينظر البشر إلى العالم بطريقة متعددة الوسائط، لذلك لدى الباحثين نفس التوقعات بالنسبة للعملاء المعتمدين على LLM. يمكن للإدراك متعدد الوسائط أن يعمق فهم الوكيل لبيئة العمل ويحسن تنوعها بشكل كبير.

إدخال النص: باعتبارها القدرة الأساسية لطلاب ماجستير إدارة الأعمال، لن أخوض في التفاصيل هنا.

** المدخلات المرئية: ** ليس لدى حاملي شهادة LLM أنفسهم قدرات الإدراك البصري ويمكنهم فقط فهم محتوى النص المنفصل. وعادة ما يحتوي الإدخال المرئي على الكثير من المعلومات حول العالم، بما في ذلك خصائص الكائنات والعلاقات المكانية وتخطيط المشهد وما إلى ذلك. الطرق الشائعة هي:

تحويل المدخلات المرئية إلى وصف نصي مطابق (التسمية التوضيحية للصورة): يمكن أن يفهمها طلاب LLM مباشرة وتتمتع بإمكانية تفسير عالية.
ترميز وتمثيل المعلومات المرئية: تتكون وحدة الإدراك من نموذج النموذج الأساسي المرئي + LLMs، ويمكن للنموذج فهم محتوى الطرائق المختلفة من خلال عمليات المحاذاة، والتي يمكن تدريبها بطريقة شاملة.

المدخلات السمعية: يعد السمع أيضًا جزءًا مهمًا من الإدراك البشري. نظرًا لأن LLMs تتمتع بإمكانيات ممتازة لاستدعاء الأدوات، فإن الفكرة البديهية هي أن الوكيل يمكنه استخدام LLMs كمركز تحكم، واستدعاء مجموعات الأدوات الموجودة أو النماذج المتخصصة بطريقة متتالية لإدراك المعلومات الصوتية. بالإضافة إلى ذلك، يمكن أيضًا تمثيل الصوت بصريًا من خلال المخطط الطيفي. يمكن استخدام المخططات الطيفية كصور مسطحة لعرض المعلومات ثنائية الأبعاد، ولذلك يمكن نقل بعض طرق المعالجة البصرية إلى مجال الكلام.

مدخلات أخرى: تتضمن المعلومات في العالم الحقيقي ما هو أكثر بكثير من مجرد النص والبصر والسمع. ويأمل المؤلفون أن يتم تجهيز العملاء الأذكياء في المستقبل بوحدات إدراك أكثر ثراءً، مثل اللمس والشم والأعضاء الأخرى، للحصول على سمات أكثر ثراءً للأشياء المستهدفة. وفي الوقت نفسه، يمكن للوكلاء أيضًا الشعور بوضوح بدرجة الحرارة والرطوبة وسطوع البيئة المحيطة واتخاذ المزيد من الإجراءات البيئية.

بالإضافة إلى ذلك، يمكن أيضًا تعريف العامل بإدراك البيئة الشاملة الأوسع: باستخدام وحدات الإدراك الناضجة مثل الليدار ونظام تحديد المواقع العالمي (GPS) ووحدات القياس بالقصور الذاتي.

** المحطة المتنقلة: الإجراء **

بعد أن يقوم الدماغ بالتحليل واتخاذ القرارات، يحتاج العامل أيضًا إلى اتخاذ إجراءات للتكيف مع البيئة أو تغييرها:

مخرجات النص: باعتبارها القدرة الأساسية لطلاب ماجستير إدارة الأعمال، لن أخوض في التفاصيل هنا.

**استخدام الأداة:**على الرغم من أن ماجستير إدارة الأعمال يتمتع باحتياطيات معرفية وقدرات مهنية ممتازة، إلا أنه عند مواجهة مشكلات محددة، قد تنشأ سلسلة من التحديات مثل مشكلات القوة والهلوسة. وفي الوقت نفسه، يمكن للأدوات، باعتبارها امتدادًا لقدرات المستخدم، تقديم المساعدة في جوانب مثل الاحترافية والواقعية وإمكانية التفسير. على سبيل المثال، يمكنك استخدام الآلة الحاسبة لحل المسائل الرياضية ومحرك البحث للبحث عن المعلومات في الوقت الفعلي.

بالإضافة إلى ذلك، يمكن للأدوات أيضًا توسيع مساحة عمل العملاء الأذكياء. على سبيل المثال، يمكن الحصول على إجراءات متعددة الوسائط من خلال استدعاء نماذج الخبراء مثل توليد الكلام وتوليد الصور. لذلك، فإن كيفية جعل الوكلاء يصبحون مستخدمين ممتازين للأدوات، أي تعلم كيفية استخدام الأدوات بفعالية، هو اتجاه مهم وواعد للغاية.

حاليًا، تشمل الطرق الرئيسية لتعلم الأدوات التعلم من العروض التوضيحية والتعلم من التعليقات. بالإضافة إلى ذلك، يمكن أيضًا استخدام التعلم التلوي وتعلم الدورة التدريبية وما إلى ذلك لتزويد الوكلاء بقدرات التعميم في استخدام الأدوات المختلفة. وللمضي قدمًا خطوة أخرى، يمكن للعملاء الأذكياء أن يتعلموا أيضًا كيفية صنع الأدوات “بالاكتفاء الذاتي”، وبالتالي زيادة استقلاليتهم واستقلاليتهم.

** الفعل المتجسد: ** يشير التجسيد إلى قدرة الوكيل على فهم البيئة وتحويلها وتحديث حالتها أثناء التفاعل مع البيئة. يعتبر العمل المتجسد بمثابة الجسر بين الذكاء الافتراضي والواقع المادي.

لدى الوكلاء التقليديين المعتمدين على التعلم المعزز قيود في كفاءة العينة والتعميم والتفكير في المشكلات المعقدة، في حين يقدم الوكلاء المعتمدون على LLM معرفة جوهرية غنية بالنماذج الكبيرة، مما يمكّن الوكلاء المتجسدين من إدراك الفيزياء والتأثير عليها بشكل فعال مثل البشر والبيئة. اعتمادًا على درجة استقلالية الوكيل في المهمة أو مدى تعقيد الإجراء، يمكن أن تكون هناك الإجراءات الذرية التالية:

يمكن أن تساعد الملاحظة الوكلاء الأذكياء في تحديد موقع أنفسهم في البيئة، وإدراك الأشياء والعناصر، والحصول على معلومات بيئية أخرى؛ *التلاعب هو إتمام بعض العمليات المحددة مثل الإمساك والدفع؛
يتطلب التنقل من الوكيل الذكي تغيير موقعه وفقًا لهدف المهمة وتحديث حالته وفقًا للمعلومات البيئية.

ومن خلال الجمع بين هذه الإجراءات الذرية، يمكن للوكلاء إكمال مهام أكثر تعقيدًا. على سبيل المثال، مهام ضمان الجودة المجسدة مثل “هل البطيخ الموجود في المطبخ أكبر من الوعاء؟” لحل هذه المشكلة، يحتاج الوكيل إلى الانتقال إلى المطبخ واستخلاص الإجابة بعد ملاحظة حجم كليهما.

بسبب التكلفة العالية لأجهزة العالم المادي ونقص مجموعات البيانات المجسدة، لا تزال الأبحاث الحالية حول الإجراءات المجسدة تركز بشكل أساسي على بيئات وضع الحماية الافتراضية مثل منصة الألعاب “Minecraft”. لذلك، من ناحية، يتطلع المؤلفون إلى نموذج مهمة ومعيار تقييم أقرب إلى الواقع. ومن ناحية أخرى، يحتاجون أيضًا إلى مزيد من الاستكشاف حول البناء الفعال لمجموعات البيانات ذات الصلة.

الوكيل في الممارسة العملية: سيناريوهات التطبيق المتنوعة

حاليًا، أظهر الوكلاء المعتمدون في LLM تنوعًا مثيرًا للإعجاب وأداءً قويًا. تزدهر أمثلة التطبيقات المألوفة مثل AutoGPT وMetaGPT وCAMEL وGPT Engineer بسرعة غير مسبوقة.

قبل تقديم تطبيقات محددة، يناقش المؤلفون مبادئ تصميم الوكيل في الممارسة:

مساعدة المستخدمين على تحرير أنفسهم من المهام اليومية والعمل المتكرر، وتقليل ضغط العمل البشري، وتحسين كفاءة حل المهام؛
لم يعد المستخدمون بحاجة إلى إصدار تعليمات صريحة منخفضة المستوى، ويمكنهم تحليل المشكلات وتخطيطها وحلها بشكل مستقل تمامًا؛
بعد تحرير يدي المستخدم، حاول تحرير الدماغ: أطلق العنان لإمكاناته في المجالات العلمية المتطورة واستكمل العمل الابتكاري والاستكشافي.

على هذا الأساس، يمكن أن يكون لتطبيق الوكلاء ثلاثة نماذج:

* ثلاثة نماذج تطبيقية للوكيل القائم على LLM: وكيل واحد، وكيل متعدد، والتفاعل بين الإنسان والحاسوب. *

سيناريو الوكيل الوحيد

إن العملاء الأذكياء الذين يمكنهم قبول أوامر اللغة البشرية الطبيعية وأداء المهام اليومية يفضلونها حاليًا من قبل المستخدمين ولها قيمة عملية عالية. قام المؤلفون أولاً بشرح سيناريوهات التطبيق المتنوعة والقدرات المقابلة في سيناريو تطبيق وكيل ذكي واحد.

في هذه المقالة، يتم تقسيم تطبيق الوكيل الذكي الواحد إلى المستويات الثلاثة التالية:

*ثلاثة مستويات من سيناريوهات تطبيق الوكيل الفردي: موجهة نحو المهام، وموجهة نحو الابتكار، وموجهة نحو دورة الحياة. *

في عملية النشر الموجهة نحو المهام، يساعد الوكيل المستخدمين البشريين على التعامل مع المهام اليومية الأساسية. يجب أن يكون لديهم فهم أساسي للأوامر، وتحليل المهام، والقدرة على التفاعل مع البيئة. على وجه التحديد، وفقًا لأنواع المهام الموجودة، يمكن تقسيم التطبيق الفعلي للوكلاء إلى بيئات شبكة محاكاة وسيناريوهات حياة محاكاة.
في عملية نشر موجهة نحو الابتكار، يمكن للوكلاء إثبات إمكانية إجراء تحقيق مستقل في المجالات العلمية المتطورة. على الرغم من أن التعقيد المتأصل ونقص بيانات التدريب من المجالات المتخصصة يعيق بناء عملاء أذكياء، إلا أن هناك بالفعل الكثير من العمل الذي يحقق تقدمًا في مجالات مثل الكيمياء والمواد والكمبيوتر وما إلى ذلك.
في عملية النشر الموجهة نحو دورة الحياة، يتمتع العملاء بالقدرة على الاستكشاف المستمر والتعلم واستخدام مهارات جديدة في عالم مفتوح، والبقاء على قيد الحياة لفترة طويلة. في هذا القسم، يأخذ المؤلفون لعبة “Minecraft” كمثال. نظرًا لأن تحدي البقاء في اللعبة يمكن اعتباره صورة مصغرة للعالم الحقيقي، فقد استخدمه العديد من الباحثين كمنصة فريدة لتطوير واختبار القدرات الشاملة للعملاء.

سيناريو متعدد الوكلاء

في وقت مبكر من عام 1986، قدم مارفن مينسكي تنبؤًا تطلعيًا. في كتابه مجتمع العقل، اقترح نظرية جديدة للذكاء، زاعمًا أن الذكاء ينشأ من تفاعل العديد من العناصر الأصغر حجمًا والمحددة الوظيفة. على سبيل المثال، قد يكون بعض الوكلاء مسؤولين عن تحديد الأنماط، بينما قد يكون آخرون مسؤولين عن اتخاذ القرارات أو إيجاد الحلول.

وقد تم تنفيذ هذه الفكرة بشكل ملموس مع ظهور الذكاء الاصطناعي الموزع. أنظمة الوكلاء المتعددين (Multi-Agent)، باعتبارها واحدة من القضايا البحثية الرئيسية، تركز بشكل أساسي على كيفية قيام الوكلاء بالتنسيق والتعاون بشكل فعال لحل المشكلات. يقسم مؤلف هذا المقال التفاعل بين الوكلاء المتعددين إلى الشكلين التاليين:

* هناك نوعان من التفاعل في سيناريوهات التطبيق متعدد الوكلاء: التفاعل التعاوني والتفاعل التصادمي. *

التفاعل التعاوني: باعتبارها النوع الأكثر انتشارًا في التطبيقات العملية، يمكن لأنظمة الوكلاء التعاونية تحسين كفاءة المهام بشكل فعال وتحسين عملية صنع القرار بشكل مشترك. على وجه التحديد، وفقًا لأشكال التعاون المختلفة، يقسم المؤلفون التفاعلات التعاونية إلى تعاون مضطرب وتعاون منظم.

عندما يعبر جميع الوكلاء بحرية عن وجهات نظرهم وآرائهم ويتعاونون بطريقة غير تسلسلية، يسمى ذلك بالتعاون المضطرب.
عندما يتبع جميع الوكلاء قواعد معينة، مثل التعبير عن آرائهم واحدًا تلو الآخر على شكل خط تجميع، فإن عملية التعاون بأكملها تكون منظمة، وهو ما يسمى بالتعاون المنظم.

التفاعل العدائي: يتفاعل العملاء الأذكياء بطريقة متبادلة. من خلال المنافسة والتفاوض والنقاش، يتخلى الوكلاء عن معتقداتهم الأصلية التي قد تكون خاطئة ويقومون بتأملات ذات معنى حول سلوكهم أو عملية التفكير الخاصة بهم، مما يؤدي في النهاية إلى تحسين جودة استجابة النظام بأكمله.

سيناريو التفاعل بين الإنسان والحاسوب

التفاعل بين الإنسان والوكيل، كما يوحي الاسم، هو وكيل ذكي يتعاون مع البشر لإكمال المهام. من ناحية، تحتاج قدرة التعلم الديناميكية للوكيل إلى دعم من خلال التواصل؛ ومن ناحية أخرى، لا يزال نظام الوكلاء الحالي غير كافٍ في قابلية التفسير وقد يواجه مشاكل تتعلق بالأمن والشرعية وما إلى ذلك، لذلك فهو يتطلب مشاركة بشرية. والإشراف.

في هذه الورقة، يقسم المؤلفون التفاعل بين الإنسان والوكيل إلى الوضعين التاليين:

*هناك وضعان في سيناريوهات التفاعل بين الإنسان والكمبيوتر: وضع المعلم والمعلم مقابل وضع الشراكة المتساوية. *

وضع المعلم والمعلم: يعمل البشر كمعلمين، حيث يقدمون التعليمات والتعليقات، بينما يعمل الوكلاء كمنفذين، حيث يقومون بالتعديل والتحسين تدريجيًا وفقًا للتعليمات. وقد تم استخدام هذا النموذج على نطاق واسع في مجالات التعليم والطب والأعمال وغيرها من المجالات.
وضع الشراكة المتساوية: لاحظت بعض الدراسات أن الوكلاء يمكنهم إظهار التعاطف في التواصل مع البشر، أو المشاركة في تنفيذ المهام على قدم المساواة. تُظهِر العوامل الذكية إمكانية تطبيقها في الحياة اليومية، ومن المتوقع أن يتم دمجها في المجتمع البشري في المستقبل.

مجتمع الوكيل: من الشخصية إلى الاجتماعية

منذ زمن طويل، كان الباحثون يحلمون ببناء “مجتمع اصطناعي تفاعلي”، فمن لعبة “Sims” إلى “Metaverse”، يمكن تلخيص تعريف الناس للمجتمع المحاكي على النحو التالي: البيئة + الأفراد الذين يعيشون ويتفاعلون في العالم. بيئة .

في هذه المقالة، يستخدم المؤلفون مخططًا لوصف الإطار المفاهيمي لمجتمع الوكلاء:

*إطار مفاهيمي للمجتمع الفاعل، مقسم إلى قسمين رئيسيين: الفاعلية والبيئة. *

وفي هذا الإطار يمكننا أن نرى:

القسم الأيسر: على المستوى الفردي، يظهر الوكلاء مجموعة متنوعة من السلوكيات الداخلية مثل التخطيط والتفكير والتفكير. بالإضافة إلى ذلك، يُظهر الوكلاء سمات شخصية جوهرية تشمل الأبعاد المعرفية والعاطفية والشخصية.
الجزء الأوسط: يمكن لوكيل واحد أن يشكل مجموعة مع وكلاء فرديين آخرين لعرض سلوكيات المجموعة بشكل مشترك، مثل التعاون.
الجزء الأيمن: يمكن أن تكون البيئة على شكل بيئة رمل افتراضية أو عالم مادي حقيقي. تشمل عناصر البيئة العناصر البشرية والموارد المختلفة المتاحة. بالنسبة لعامل واحد، يعد الوكلاء الآخرون أيضًا جزءًا من البيئة.
التفاعل الشامل: يشارك الوكلاء بفعالية في عملية التفاعل بأكملها من خلال استشعار البيئة الخارجية واتخاذ الإجراءات.

** السلوك الاجتماعي وشخصية الوكلاء **

يتناول المقال أداء الفاعلين في المجتمع من منظور السلوك الخارجي والشخصية الداخلية:

السلوك الاجتماعي: من الناحية الاجتماعية يمكن تقسيم السلوك إلى مستويين: فردي وجماعي:

يشكل السلوك الفردي الأساس لعمل العامل نفسه وتطويره. ويشمل المدخلات التي يمثلها الإدراك، والمخرجات التي يمثلها الفعل، والسلوك الداخلي للفاعل.
يشير سلوك الحشود إلى السلوك الذي يحدث عندما يتفاعل اثنان أو أكثر من الوكلاء بشكل عفوي. وتشمل السلوكيات الإيجابية المتمثلة في التعاون، والسلوكيات السلبية المتمثلة في الصراع، والسلوكيات المحايدة مثل متابعة القطيع والمراقبة.

الشخصية: بما في ذلك الإدراك والعاطفة والشخصية. مثلما يقوم البشر بتطوير سماتهم الخاصة تدريجيًا من خلال عملية التنشئة الاجتماعية، يُظهر الوكلاء أيضًا ما يسمى “الذكاء الشبيه بالإنسان”، وهو التشكيل التدريجي للشخصية من خلال التفاعل مع المجموعات والبيئات.

القدرات المعرفية: تغطي العملية التي من خلالها يكتسب الوكلاء المعرفة ويفهمونها، وتظهر الأبحاث أن الوكلاء المعتمدين على LLM يمكنهم إظهار المداولات والذكاء المشابه للبشر في بعض الجوانب.
الذكاء العاطفي: وينطوي على المشاعر الذاتية والحالات العاطفية، مثل الفرح، والغضب، والحزن، والفرح، بالإضافة إلى القدرة على إظهار التعاطف والتعاطف.
الشخصية (تصوير الشخصية): من أجل فهم وتحليل الخصائص الشخصية لماجستير القانون، استخدم الباحثون أساليب تقييم ناضجة، مثل اختبارات الشخصية الخمسة الكبرى وMBTI، لاستكشاف تنوع الشخصية وتعقيدها.

** محاكاة بيئة التشغيل الاجتماعية **

لا يتكون المجتمع الفاعل من أفراد مستقلين فحسب، بل يشمل أيضًا البيئة التي يتفاعلون معها. تؤثر البيئة على كيفية إدراك الوكلاء وتصرفهم وتفاعلهم. وفي المقابل، يقوم الوكلاء أيضًا بتغيير حالة البيئة من خلال أفعالهم وقراراتهم. بالنسبة للوكيل الفردي، تشتمل البيئة على عوامل مستقلة أخرى، والبشر، والموارد المتاحة.

هنا، يستكشف المؤلفون ثلاثة أنواع من البيئات:

البيئات المستندة إلى النصوص: نظرًا لأن حاملي شهادات LLM يعتمدون بشكل أساسي على اللغة كتنسيقات الإدخال والإخراج الخاصة بهم، فإن البيئات المستندة إلى النصوص هي منصة التشغيل الأكثر طبيعية للوكلاء. يتم وصف الظواهر والتفاعلات الاجتماعية من خلال الكلمات، وتوفر البيئة النصية المعرفة الدلالية والخلفية. يوجد الفاعلون في مثل هذه العوالم النصية ويعتمدون على الموارد النصية للإدراك والتفكير والتصرف.

بيئة الحماية الافتراضية: في مجال الكمبيوتر، تشير بيئة الحماية إلى بيئة خاضعة للتحكم ومعزولة، وغالبًا ما تُستخدم لاختبار البرامج وتحليل الفيروسات. تعمل بيئة الحماية الافتراضية للمجتمع الوكيل كمنصة لمحاكاة التفاعل الاجتماعي والمحاكاة السلوكية، وتشمل ميزاتها الرئيسية ما يلي:

التصور: يمكنك استخدام واجهات رسومية بسيطة ثنائية الأبعاد أو حتى نماذج ثلاثية الأبعاد معقدة لعرض العالم، وتصوير جميع جوانب المجتمع المحاكى بطريقة بديهية.
قابلية التوسع: يمكن إنشاء ونشر سيناريوهات مختلفة مختلفة (الويب، والألعاب، وما إلى ذلك) لإجراء تجارب متنوعة، مما يوفر مساحة واسعة للوكلاء لاستكشافها.

البيئة المادية الحقيقية: البيئة المادية هي البيئة الملموسة التي تتكون من أشياء ومساحات فعلية يراقب فيها الوكلاء ويتصرفون. تقدم هذه البيئة مدخلات حسية غنية (بصرية، سمعية، ومكانية). على عكس البيئات الافتراضية، تضع المساحات المادية متطلبات أكبر على سلوك الوكيل. وهذا يعني أن العامل يجب أن يكون قابلاً للتكيف في البيئة المادية ويولد تحكمًا قابلاً للتنفيذ في الحركة.

ويعطي المؤلف مثالا لشرح مدى تعقيد البيئة المادية: تخيل وكيلا ذكيا يقوم بتشغيل ذراع آلية في مصنع. عند تشغيل الذراع الآلية، يلزم التحكم الدقيق في القوة لتجنب إتلاف أشياء من مواد مختلفة؛ بالإضافة إلى ذلك، يجب أن يكون الوكيل في مساحة العمل الفعلية. قم بالتنقل وضبط مسار الحركة في الوقت المناسب لتجنب العوائق وتحسين مسار حركة الذراع الآلية.

تزيد هذه المتطلبات من تعقيد وتحدي العوامل في البيئة المادية.

المحاكاة، ابدأ!

في المقال، يعتقد المؤلفون أن المجتمع المحاكى يجب أن يكون منفتحًا ومستمرًا وظرفيًا ومنظمًا. يسمح الانفتاح للفاعلين بالدخول والخروج من المجتمع المحاكي بشكل مستقل؛ ويعني الثبات أن المجتمع لديه مسار متماسك يتطور مع مرور الوقت؛ ويؤكد السياق على وجود الأفراد وعملهم في بيئة محددة؛ ويضمن التنظيم أن المجتمع المحاكي لديه عالم مادي. مثل القواعد والقيود.

أما بالنسبة لأهمية المجتمع المحاكي، فإن مدينة الوكلاء المولدين بجامعة ستانفورد تقدم مثالًا حيًا للجميع - يمكن استخدام مجتمع الوكلاء لاستكشاف قدرات الذكاء الجماعي، على سبيل المثال، قام العملاء بتنظيم حفلة عيد الحب بشكل مشترك؛ ويمكن استخدامه أيضًا لتسريع أبحاث العلوم الاجتماعية، مثل مراقبة ظواهر الاتصال من خلال محاكاة الشبكات الاجتماعية. بالإضافة إلى ذلك، هناك أيضًا دراسات لاستكشاف القيم الكامنة وراء الوكلاء من خلال محاكاة سيناريوهات اتخاذ القرار الأخلاقي، وللمساعدة في اتخاذ القرار من خلال محاكاة تأثير السياسات على المجتمع.

علاوة على ذلك، أشار المؤلف إلى أن هذه المحاكاة قد يكون لها أيضًا مخاطر معينة، بما في ذلك على سبيل المثال لا الحصر: الظواهر الاجتماعية الضارة، والصور النمطية والأحكام المسبقة، وقضايا الخصوصية والأمن، والإفراط في الاعتماد والإدمان.

أسئلة مفتوحة تطلعية

في نهاية المقالة، يناقش المؤلف أيضًا بعض الأسئلة المفتوحة التطلعية ويقدم بعض الإلهام للقراء للتفكير فيها:

**كيف يمكن للبحث عن العملاء الأذكياء ونماذج اللغات الكبيرة أن يعززوا بعضهم البعض ويتطوروا معًا؟ **أظهرت النماذج الكبيرة إمكانات قوية في فهم اللغة وصنع القرار وقدرات التعميم، وأصبحت دورًا رئيسيًا في عملية بناء الوكلاء، كما أدى تقدم الوكلاء أيضًا إلى طرح متطلبات أعلى للنماذج الكبيرة.

** ما هي التحديات والمخاوف التي سيجلبها الوكلاء المعتمدون في LLM؟ ** إن إمكانية تطبيق العملاء الأذكياء حقًا يتطلب تقييمًا أمنيًا صارمًا لتجنب الإضرار بالعالم الحقيقي. ويلخص المؤلف المزيد من التهديدات المحتملة، مثل: الانتهاكات غير القانونية، وخطر البطالة، والتأثير على رفاهية الإنسان، وما إلى ذلك.

**ما هي الفرص والتحديات التي سيجلبها توسيع النطاق؟ **في مجتمع المحاكاة، يمكن أن تؤدي زيادة عدد الأفراد إلى تحسين مصداقية وأصالة المحاكاة بشكل كبير. ومع ذلك، مع زيادة عدد العملاء، ستصبح مشاكل الاتصال ونشر الرسائل معقدة للغاية، وسيؤدي تشويه المعلومات أو سوء الفهم أو الهلوسة إلى تقليل كفاءة نظام المحاكاة بأكمله بشكل كبير.

**هناك جدل على الإنترنت حول ما إذا كان الوكيل المعتمد على LLM هو المسار المناسب للذكاء الاصطناعي العام (AGI). **يعتقد بعض الباحثين أن النماذج الكبيرة التي يمثلها GPT-4 قد تم تدريبها على مجموعة كافية، والعوامل المبنية على هذا الأساس لديها القدرة على أن تصبح المفتاح لفتح الباب أمام الذكاء الاصطناعي العام. لكن باحثين آخرين يعتقدون أن النمذجة اللغوية التراجعية التلقائية لا تظهر ذكاء حقيقيا لأنها تستجيب فقط. يمكن أن تؤدي طريقة النمذجة الأكثر اكتمالا، مثل النموذج العالمي، إلى الذكاء الاصطناعي العام.

** تطور ذكاء السرب. ذكاء السرب هو عملية جمع آراء العديد من الأشخاص وتحويلها إلى قرارات. **ومع ذلك، هل سيتم إنتاج “الاستخبارات” الحقيقية بمجرد زيادة عدد العملاء؟ بالإضافة إلى ذلك، كيف يمكن التنسيق بين الوكلاء الأفراد لتمكين مجتمع من الوكلاء الأذكياء من التغلب على “التفكير الجماعي” والتحيزات المعرفية الشخصية؟

** الوكيل كخدمة (AaaS). **نظرًا لأن الوكلاء المعتمدين على LLM أكثر تعقيدًا من النموذج الكبير نفسه، ويصعب على المؤسسات الصغيرة والمتوسطة الحجم أو الأفراد بناءهم محليًا، يمكن لموردي الخدمات السحابية التفكير في تنفيذ وكلاء أذكياء في شكل خدمات، أي الوكيل -كخدمة. مثل الخدمات السحابية الأخرى، تتمتع AaaS بالقدرة على تزويد المستخدمين بمرونة عالية وخدمة ذاتية عند الطلب.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

تعليق

0/400

لا توجد تعليقات

أصدر فريق Fudan NLP نظرة عامة مكونة من 80 صفحة عن وكلاء النماذج واسعة النطاق، مما يوفر نظرة عامة على الوضع الحالي ومستقبل عملاء الذكاء الاصطناعي في مقال واحد