المصدر: قلب الآلة
مؤخرًا، أطلق فريق معالجة اللغات الطبيعية بجامعة فودان (FudanNLP) ورقة مراجعة حول الوكلاء المعتمدين على LLM. يبلغ طول النص الكامل 86 صفحة ويحتوي على أكثر من 600 مرجع! بدءًا من تاريخ وكلاء الذكاء الاصطناعي، قام المؤلفون بتصنيف الوضع الحالي للعملاء الأذكياء بشكل شامل استنادًا إلى نماذج لغوية كبيرة، بما في ذلك: الخلفية، والتكوين، وسيناريوهات تطبيق الوكلاء المعتمدين على LLM، ومجتمع الوكلاء الذي نوقش كثيرًا**. في الوقت نفسه، ناقش المؤلفون القضايا التطلعية والمفتوحة المتعلقة بالوكيل، والتي لها قيمة كبيرة لاتجاهات التطوير المستقبلية في المجالات ذات الصلة.
* رابط الورق:
**سيضيف أعضاء الفريق أيضًا “ملخصًا من جملة واحدة” إلى كل ورقة ذات صلة، مرحبًا بك في مستودع Star. **
لفترة طويلة، كان الباحثون يتابعون الذكاء العام الاصطناعي (AGI) الذي يعادل المستويات البشرية أو حتى يتجاوزها. في وقت مبكر من الخمسينيات، قام آلان تورينج بتوسيع مفهوم “الذكاء” ليشمل الكيانات الاصطناعية واقترح اختبار تورينج الشهير. غالبًا ما تسمى كيانات الذكاء الاصطناعي هذه بالوكلاء. ينشأ مفهوم “الوكيل” من الفلسفة ويصف كيانًا لديه رغبات ومعتقدات ونوايا وقدرة على اتخاذ الإجراءات. وفي مجال الذكاء الاصطناعي، أُعطي هذا المصطلح معنى جديدًا: كيانات ذكية تتميز بخصائص الاستقلالية والتفاعلية والإيجابية والتواصل الاجتماعي.
**لا يوجد إجماع على الترجمة الصينية لمصطلح “وكيل”، حيث يترجمها بعض العلماء على أنها وكيل أو فاعل أو وكيل أو وكيل ذكي. ويشير كل من “الوكيل” و"الوكيل الذكي" اللذين يظهران في هذه المقالة إلى الوكيل. *
منذ ذلك الحين، أصبح تصميم العملاء محور اهتمام مجتمع الذكاء الاصطناعي. ومع ذلك، ركز العمل السابق بشكل أساسي على تعزيز قدرات محددة للعملاء، مثل التفكير الرمزي أو إتقان مهام محددة (الشطرنج، Go، وما إلى ذلك). تركز هذه الدراسات بشكل أكبر على تصميم الخوارزميات واستراتيجيات التدريب، مع تجاهل تطوير القدرات العامة الكامنة في النموذج، مثل ذاكرة المعرفة، والتخطيط طويل المدى، والتعميم الفعال، والتفاعل الفعال. لقد اتضح أن تعزيز القدرات المتأصلة في النموذج يعد عاملاً رئيسيًا في تعزيز التطوير الإضافي للوكلاء الأذكياء. **
إن ظهور نماذج لغوية كبيرة (LLMs) يجلب الأمل لمزيد من التطوير للوكلاء الأذكياء. إذا تم تقسيم مسار التطوير من البرمجة اللغوية العصبية إلى الذكاء الاصطناعي العام (AGI) إلى خمسة مستويات: المتن، والإنترنت، والإدراك، والتجسيد، والسمات الاجتماعية، فإن نموذج اللغة الحالي واسع النطاق قد وصل إلى المستوى الثاني، مع إدخال وإخراج النص على نطاق الإنترنت. على هذا الأساس، إذا تم منح الوكلاء المعتمدين على LLM مساحة للإدراك ومساحة للعمل، فسوف يصلون إلى المستويين الثالث والرابع. علاوة على ذلك، عندما يتفاعل العديد من الوكلاء ويتعاونون لحل مهام أكثر تعقيدًا، أو تعكس السلوكيات الاجتماعية في العالم الحقيقي، فإن لديهم القدرة على الوصول إلى المستوى الخامس - مجتمع الوكلاء.
* يتصور المؤلفون مجتمعًا متناغمًا من العناصر الذكية التي يمكن للبشر أيضًا المشاركة فيها. المشهد مأخوذ من مهرجان Sea Lantern في فيلم “Genshin Impact”. *
كيف سيبدو الوكيل الذكي المدعوم بنموذج كبير؟ مستوحاة من قانون “البقاء للأصلح” لداروين، اقترح المؤلفون إطارًا عامًا للوكلاء الأذكياء يعتمد على نماذج كبيرة. إذا أراد الإنسان البقاء في المجتمع، عليه أن يتعلم التكيف مع البيئة، لذلك يحتاج إلى قدرات معرفية وأن يكون قادراً على إدراك التغيرات في العالم الخارجي والاستجابة لها. وبالمثل، يتكون إطار الوكلاء الأذكياء أيضًا من ثلاثة أجزاء: **محطة التحكم (الدماغ)، ومحطة الإدراك (الإدراك)، ومحطة العمل (الفعل). **
يتكون الإطار المفاهيمي للوكيل القائم على LLM من ثلاثة مكونات: نهاية التحكم (الدماغ)، ونهاية الإدراك (الإدراك) ونهاية الإجراء (الإجراء).
يستخدم المؤلفون مثالاً لتوضيح سير عمل الوكيل المعتمد على LLM: عندما يسأل الإنسان ما إذا كان سيهطل المطر، تقوم نهاية الإدراك (الإدراك) بتحويل التعليمات إلى تمثيل يمكن أن يفهمه LLM. ثم تبدأ محطة التحكم (Brain) في التفكير والتخطيط للعمل بناءً على توقعات الطقس والطقس الحالية على الإنترنت. وأخيراً يستجيب الفعل ويسلم المظلة للإنسان.
من خلال تكرار العملية المذكورة أعلاه، يمكن للوكيل الذكي الحصول بشكل مستمر على ردود الفعل والتفاعل مع البيئة.
** محطة التحكم: الدماغ **
باعتباره المكون الأساسي للوكيل الذكي، يقدم المؤلفون قدراته من خمسة جوانب:
**التفاعل اللغوي الطبيعي: **اللغة هي وسيلة التواصل وتحتوي على معلومات غنية. بفضل القدرة القوية على توليد اللغة الطبيعية وإمكانيات الفهم التي يتمتع بها حاملو شهادة LLM، يمكن للوكلاء الأذكياء التفاعل مع العالم الخارجي لجولات متعددة من خلال اللغة الطبيعية لتحقيق أهدافهم. وعلى وجه التحديد، يمكن تقسيمها إلى جانبين:
المعرفة: يتمتع طلاب ماجستير القانون الذين تم تدريبهم استنادًا إلى مجموعات كبيرة من النصوص بالقدرة على تخزين كميات هائلة من المعرفة. بالإضافة إلى المعرفة اللغوية، تعد معرفة الفطرة السليمة ومعرفة المهارات المهنية مكونات مهمة للوكلاء المعتمدين على LLM.
على الرغم من أن ماجستير إدارة الأعمال أنفسهم لا يزال لديهم مشاكل مثل المعرفة منتهية الصلاحية والهلوسة، إلا أن بعض الأبحاث الحالية يمكن أن تخفف منها إلى حد ما من خلال تحرير المعرفة أو استدعاء قواعد المعرفة الخارجية.
الذاكرة: في إطار هذه المقالة، تقوم وحدة الذاكرة (الذاكرة) بتخزين الملاحظات والأفكار وتسلسلات الإجراءات السابقة للوكيل. ومن خلال آليات ذاكرة محددة، يمكن للوكلاء التفكير بشكل فعال في الاستراتيجيات السابقة وتطبيقها، مما يسمح لهم بالاستفادة من تجارب الماضي للتكيف مع البيئات غير المألوفة.
هناك ثلاث طرق شائعة الاستخدام لتحسين قدرة الذاكرة:
بالإضافة إلى ذلك، تعد طريقة استرجاع الذاكرة مهمة أيضًا، ولا يمكن للوكيل الوصول إلى المعلومات الأكثر دقة ووثيقة الصلة إلا من خلال استرجاع المحتوى المناسب.
الاستدلال والتخطيط: تعد القدرة على الاستدلال (الاستدلال) أمرًا بالغ الأهمية للعملاء الأذكياء لأداء المهام المعقدة مثل اتخاذ القرار والتحليل. خاصة بـ LLMs، فهي عبارة عن سلسلة من أساليب التحفيز التي تمثلها سلسلة الفكر (CoT). التخطيط هو استراتيجية شائعة الاستخدام عند مواجهة تحديات كبيرة. فهو يساعد الوكلاء على تنظيم تفكيرهم وتحديد الأهداف وتحديد الخطوات اللازمة لتحقيق تلك الأهداف. في التنفيذ المحدد، يمكن أن يتضمن التخطيط خطوتين:
** قابلية النقل والتعميم: ** يمنح حاملو ماجستير إدارة الأعمال الذين يتمتعون بالمعرفة العالمية الوكلاء الأذكياء بقدرات قوية على الترحيل والتعميم. الوكيل الجيد ليس قاعدة معرفية ثابتة، ولكنه يتمتع أيضًا بقدرات تعلم ديناميكية:
نهاية الإدراك: الإدراك
ينظر البشر إلى العالم بطريقة متعددة الوسائط، لذلك لدى الباحثين نفس التوقعات بالنسبة للعملاء المعتمدين على LLM. يمكن للإدراك متعدد الوسائط أن يعمق فهم الوكيل لبيئة العمل ويحسن تنوعها بشكل كبير.
إدخال النص: باعتبارها القدرة الأساسية لطلاب ماجستير إدارة الأعمال، لن أخوض في التفاصيل هنا.
** المدخلات المرئية: ** ليس لدى حاملي شهادة LLM أنفسهم قدرات الإدراك البصري ويمكنهم فقط فهم محتوى النص المنفصل. وعادة ما يحتوي الإدخال المرئي على الكثير من المعلومات حول العالم، بما في ذلك خصائص الكائنات والعلاقات المكانية وتخطيط المشهد وما إلى ذلك. الطرق الشائعة هي:
المدخلات السمعية: يعد السمع أيضًا جزءًا مهمًا من الإدراك البشري. نظرًا لأن LLMs تتمتع بإمكانيات ممتازة لاستدعاء الأدوات، فإن الفكرة البديهية هي أن الوكيل يمكنه استخدام LLMs كمركز تحكم، واستدعاء مجموعات الأدوات الموجودة أو النماذج المتخصصة بطريقة متتالية لإدراك المعلومات الصوتية. بالإضافة إلى ذلك، يمكن أيضًا تمثيل الصوت بصريًا من خلال المخطط الطيفي. يمكن استخدام المخططات الطيفية كصور مسطحة لعرض المعلومات ثنائية الأبعاد، ولذلك يمكن نقل بعض طرق المعالجة البصرية إلى مجال الكلام.
مدخلات أخرى: تتضمن المعلومات في العالم الحقيقي ما هو أكثر بكثير من مجرد النص والبصر والسمع. ويأمل المؤلفون أن يتم تجهيز العملاء الأذكياء في المستقبل بوحدات إدراك أكثر ثراءً، مثل اللمس والشم والأعضاء الأخرى، للحصول على سمات أكثر ثراءً للأشياء المستهدفة. وفي الوقت نفسه، يمكن للوكلاء أيضًا الشعور بوضوح بدرجة الحرارة والرطوبة وسطوع البيئة المحيطة واتخاذ المزيد من الإجراءات البيئية.
بالإضافة إلى ذلك، يمكن أيضًا تعريف العامل بإدراك البيئة الشاملة الأوسع: باستخدام وحدات الإدراك الناضجة مثل الليدار ونظام تحديد المواقع العالمي (GPS) ووحدات القياس بالقصور الذاتي.
** المحطة المتنقلة: الإجراء **
بعد أن يقوم الدماغ بالتحليل واتخاذ القرارات، يحتاج العامل أيضًا إلى اتخاذ إجراءات للتكيف مع البيئة أو تغييرها:
مخرجات النص: باعتبارها القدرة الأساسية لطلاب ماجستير إدارة الأعمال، لن أخوض في التفاصيل هنا.
**استخدام الأداة:**على الرغم من أن ماجستير إدارة الأعمال يتمتع باحتياطيات معرفية وقدرات مهنية ممتازة، إلا أنه عند مواجهة مشكلات محددة، قد تنشأ سلسلة من التحديات مثل مشكلات القوة والهلوسة. وفي الوقت نفسه، يمكن للأدوات، باعتبارها امتدادًا لقدرات المستخدم، تقديم المساعدة في جوانب مثل الاحترافية والواقعية وإمكانية التفسير. على سبيل المثال، يمكنك استخدام الآلة الحاسبة لحل المسائل الرياضية ومحرك البحث للبحث عن المعلومات في الوقت الفعلي.
بالإضافة إلى ذلك، يمكن للأدوات أيضًا توسيع مساحة عمل العملاء الأذكياء. على سبيل المثال، يمكن الحصول على إجراءات متعددة الوسائط من خلال استدعاء نماذج الخبراء مثل توليد الكلام وتوليد الصور. لذلك، فإن كيفية جعل الوكلاء يصبحون مستخدمين ممتازين للأدوات، أي تعلم كيفية استخدام الأدوات بفعالية، هو اتجاه مهم وواعد للغاية.
حاليًا، تشمل الطرق الرئيسية لتعلم الأدوات التعلم من العروض التوضيحية والتعلم من التعليقات. بالإضافة إلى ذلك، يمكن أيضًا استخدام التعلم التلوي وتعلم الدورة التدريبية وما إلى ذلك لتزويد الوكلاء بقدرات التعميم في استخدام الأدوات المختلفة. وللمضي قدمًا خطوة أخرى، يمكن للعملاء الأذكياء أن يتعلموا أيضًا كيفية صنع الأدوات “بالاكتفاء الذاتي”، وبالتالي زيادة استقلاليتهم واستقلاليتهم.
** الفعل المتجسد: ** يشير التجسيد إلى قدرة الوكيل على فهم البيئة وتحويلها وتحديث حالتها أثناء التفاعل مع البيئة. يعتبر العمل المتجسد بمثابة الجسر بين الذكاء الافتراضي والواقع المادي.
لدى الوكلاء التقليديين المعتمدين على التعلم المعزز قيود في كفاءة العينة والتعميم والتفكير في المشكلات المعقدة، في حين يقدم الوكلاء المعتمدون على LLM معرفة جوهرية غنية بالنماذج الكبيرة، مما يمكّن الوكلاء المتجسدين من إدراك الفيزياء والتأثير عليها بشكل فعال مثل البشر والبيئة. اعتمادًا على درجة استقلالية الوكيل في المهمة أو مدى تعقيد الإجراء، يمكن أن تكون هناك الإجراءات الذرية التالية:
ومن خلال الجمع بين هذه الإجراءات الذرية، يمكن للوكلاء إكمال مهام أكثر تعقيدًا. على سبيل المثال، مهام ضمان الجودة المجسدة مثل “هل البطيخ الموجود في المطبخ أكبر من الوعاء؟” لحل هذه المشكلة، يحتاج الوكيل إلى الانتقال إلى المطبخ واستخلاص الإجابة بعد ملاحظة حجم كليهما.
بسبب التكلفة العالية لأجهزة العالم المادي ونقص مجموعات البيانات المجسدة، لا تزال الأبحاث الحالية حول الإجراءات المجسدة تركز بشكل أساسي على بيئات وضع الحماية الافتراضية مثل منصة الألعاب “Minecraft”. لذلك، من ناحية، يتطلع المؤلفون إلى نموذج مهمة ومعيار تقييم أقرب إلى الواقع. ومن ناحية أخرى، يحتاجون أيضًا إلى مزيد من الاستكشاف حول البناء الفعال لمجموعات البيانات ذات الصلة.
حاليًا، أظهر الوكلاء المعتمدون في LLM تنوعًا مثيرًا للإعجاب وأداءً قويًا. تزدهر أمثلة التطبيقات المألوفة مثل AutoGPT وMetaGPT وCAMEL وGPT Engineer بسرعة غير مسبوقة.
قبل تقديم تطبيقات محددة، يناقش المؤلفون مبادئ تصميم الوكيل في الممارسة:
مساعدة المستخدمين على تحرير أنفسهم من المهام اليومية والعمل المتكرر، وتقليل ضغط العمل البشري، وتحسين كفاءة حل المهام؛
لم يعد المستخدمون بحاجة إلى إصدار تعليمات صريحة منخفضة المستوى، ويمكنهم تحليل المشكلات وتخطيطها وحلها بشكل مستقل تمامًا؛
بعد تحرير يدي المستخدم، حاول تحرير الدماغ: أطلق العنان لإمكاناته في المجالات العلمية المتطورة واستكمل العمل الابتكاري والاستكشافي.
على هذا الأساس، يمكن أن يكون لتطبيق الوكلاء ثلاثة نماذج:
* ثلاثة نماذج تطبيقية للوكيل القائم على LLM: وكيل واحد، وكيل متعدد، والتفاعل بين الإنسان والحاسوب. *
سيناريو الوكيل الوحيد
إن العملاء الأذكياء الذين يمكنهم قبول أوامر اللغة البشرية الطبيعية وأداء المهام اليومية يفضلونها حاليًا من قبل المستخدمين ولها قيمة عملية عالية. قام المؤلفون أولاً بشرح سيناريوهات التطبيق المتنوعة والقدرات المقابلة في سيناريو تطبيق وكيل ذكي واحد.
في هذه المقالة، يتم تقسيم تطبيق الوكيل الذكي الواحد إلى المستويات الثلاثة التالية:
*ثلاثة مستويات من سيناريوهات تطبيق الوكيل الفردي: موجهة نحو المهام، وموجهة نحو الابتكار، وموجهة نحو دورة الحياة. *
سيناريو متعدد الوكلاء
في وقت مبكر من عام 1986، قدم مارفن مينسكي تنبؤًا تطلعيًا. في كتابه مجتمع العقل، اقترح نظرية جديدة للذكاء، زاعمًا أن الذكاء ينشأ من تفاعل العديد من العناصر الأصغر حجمًا والمحددة الوظيفة. على سبيل المثال، قد يكون بعض الوكلاء مسؤولين عن تحديد الأنماط، بينما قد يكون آخرون مسؤولين عن اتخاذ القرارات أو إيجاد الحلول.
وقد تم تنفيذ هذه الفكرة بشكل ملموس مع ظهور الذكاء الاصطناعي الموزع. أنظمة الوكلاء المتعددين (Multi-Agent)، باعتبارها واحدة من القضايا البحثية الرئيسية، تركز بشكل أساسي على كيفية قيام الوكلاء بالتنسيق والتعاون بشكل فعال لحل المشكلات. يقسم مؤلف هذا المقال التفاعل بين الوكلاء المتعددين إلى الشكلين التاليين:
* هناك نوعان من التفاعل في سيناريوهات التطبيق متعدد الوكلاء: التفاعل التعاوني والتفاعل التصادمي. *
التفاعل التعاوني: باعتبارها النوع الأكثر انتشارًا في التطبيقات العملية، يمكن لأنظمة الوكلاء التعاونية تحسين كفاءة المهام بشكل فعال وتحسين عملية صنع القرار بشكل مشترك. على وجه التحديد، وفقًا لأشكال التعاون المختلفة، يقسم المؤلفون التفاعلات التعاونية إلى تعاون مضطرب وتعاون منظم.
التفاعل العدائي: يتفاعل العملاء الأذكياء بطريقة متبادلة. من خلال المنافسة والتفاوض والنقاش، يتخلى الوكلاء عن معتقداتهم الأصلية التي قد تكون خاطئة ويقومون بتأملات ذات معنى حول سلوكهم أو عملية التفكير الخاصة بهم، مما يؤدي في النهاية إلى تحسين جودة استجابة النظام بأكمله.
سيناريو التفاعل بين الإنسان والحاسوب
التفاعل بين الإنسان والوكيل، كما يوحي الاسم، هو وكيل ذكي يتعاون مع البشر لإكمال المهام. من ناحية، تحتاج قدرة التعلم الديناميكية للوكيل إلى دعم من خلال التواصل؛ ومن ناحية أخرى، لا يزال نظام الوكلاء الحالي غير كافٍ في قابلية التفسير وقد يواجه مشاكل تتعلق بالأمن والشرعية وما إلى ذلك، لذلك فهو يتطلب مشاركة بشرية. والإشراف.
في هذه الورقة، يقسم المؤلفون التفاعل بين الإنسان والوكيل إلى الوضعين التاليين:
*هناك وضعان في سيناريوهات التفاعل بين الإنسان والكمبيوتر: وضع المعلم والمعلم مقابل وضع الشراكة المتساوية. *
منذ زمن طويل، كان الباحثون يحلمون ببناء “مجتمع اصطناعي تفاعلي”، فمن لعبة “Sims” إلى “Metaverse”، يمكن تلخيص تعريف الناس للمجتمع المحاكي على النحو التالي: البيئة + الأفراد الذين يعيشون ويتفاعلون في العالم. بيئة .
في هذه المقالة، يستخدم المؤلفون مخططًا لوصف الإطار المفاهيمي لمجتمع الوكلاء:
*إطار مفاهيمي للمجتمع الفاعل، مقسم إلى قسمين رئيسيين: الفاعلية والبيئة. *
وفي هذا الإطار يمكننا أن نرى:
** السلوك الاجتماعي وشخصية الوكلاء **
يتناول المقال أداء الفاعلين في المجتمع من منظور السلوك الخارجي والشخصية الداخلية:
السلوك الاجتماعي: من الناحية الاجتماعية يمكن تقسيم السلوك إلى مستويين: فردي وجماعي:
الشخصية: بما في ذلك الإدراك والعاطفة والشخصية. مثلما يقوم البشر بتطوير سماتهم الخاصة تدريجيًا من خلال عملية التنشئة الاجتماعية، يُظهر الوكلاء أيضًا ما يسمى “الذكاء الشبيه بالإنسان”، وهو التشكيل التدريجي للشخصية من خلال التفاعل مع المجموعات والبيئات.
** محاكاة بيئة التشغيل الاجتماعية **
لا يتكون المجتمع الفاعل من أفراد مستقلين فحسب، بل يشمل أيضًا البيئة التي يتفاعلون معها. تؤثر البيئة على كيفية إدراك الوكلاء وتصرفهم وتفاعلهم. وفي المقابل، يقوم الوكلاء أيضًا بتغيير حالة البيئة من خلال أفعالهم وقراراتهم. بالنسبة للوكيل الفردي، تشتمل البيئة على عوامل مستقلة أخرى، والبشر، والموارد المتاحة.
هنا، يستكشف المؤلفون ثلاثة أنواع من البيئات:
البيئات المستندة إلى النصوص: نظرًا لأن حاملي شهادات LLM يعتمدون بشكل أساسي على اللغة كتنسيقات الإدخال والإخراج الخاصة بهم، فإن البيئات المستندة إلى النصوص هي منصة التشغيل الأكثر طبيعية للوكلاء. يتم وصف الظواهر والتفاعلات الاجتماعية من خلال الكلمات، وتوفر البيئة النصية المعرفة الدلالية والخلفية. يوجد الفاعلون في مثل هذه العوالم النصية ويعتمدون على الموارد النصية للإدراك والتفكير والتصرف.
بيئة الحماية الافتراضية: في مجال الكمبيوتر، تشير بيئة الحماية إلى بيئة خاضعة للتحكم ومعزولة، وغالبًا ما تُستخدم لاختبار البرامج وتحليل الفيروسات. تعمل بيئة الحماية الافتراضية للمجتمع الوكيل كمنصة لمحاكاة التفاعل الاجتماعي والمحاكاة السلوكية، وتشمل ميزاتها الرئيسية ما يلي:
البيئة المادية الحقيقية: البيئة المادية هي البيئة الملموسة التي تتكون من أشياء ومساحات فعلية يراقب فيها الوكلاء ويتصرفون. تقدم هذه البيئة مدخلات حسية غنية (بصرية، سمعية، ومكانية). على عكس البيئات الافتراضية، تضع المساحات المادية متطلبات أكبر على سلوك الوكيل. وهذا يعني أن العامل يجب أن يكون قابلاً للتكيف في البيئة المادية ويولد تحكمًا قابلاً للتنفيذ في الحركة.
ويعطي المؤلف مثالا لشرح مدى تعقيد البيئة المادية: تخيل وكيلا ذكيا يقوم بتشغيل ذراع آلية في مصنع. عند تشغيل الذراع الآلية، يلزم التحكم الدقيق في القوة لتجنب إتلاف أشياء من مواد مختلفة؛ بالإضافة إلى ذلك، يجب أن يكون الوكيل في مساحة العمل الفعلية. قم بالتنقل وضبط مسار الحركة في الوقت المناسب لتجنب العوائق وتحسين مسار حركة الذراع الآلية.
تزيد هذه المتطلبات من تعقيد وتحدي العوامل في البيئة المادية.
في المقال، يعتقد المؤلفون أن المجتمع المحاكى يجب أن يكون منفتحًا ومستمرًا وظرفيًا ومنظمًا. يسمح الانفتاح للفاعلين بالدخول والخروج من المجتمع المحاكي بشكل مستقل؛ ويعني الثبات أن المجتمع لديه مسار متماسك يتطور مع مرور الوقت؛ ويؤكد السياق على وجود الأفراد وعملهم في بيئة محددة؛ ويضمن التنظيم أن المجتمع المحاكي لديه عالم مادي. مثل القواعد والقيود.
أما بالنسبة لأهمية المجتمع المحاكي، فإن مدينة الوكلاء المولدين بجامعة ستانفورد تقدم مثالًا حيًا للجميع - يمكن استخدام مجتمع الوكلاء لاستكشاف قدرات الذكاء الجماعي، على سبيل المثال، قام العملاء بتنظيم حفلة عيد الحب بشكل مشترك؛ ويمكن استخدامه أيضًا لتسريع أبحاث العلوم الاجتماعية، مثل مراقبة ظواهر الاتصال من خلال محاكاة الشبكات الاجتماعية. بالإضافة إلى ذلك، هناك أيضًا دراسات لاستكشاف القيم الكامنة وراء الوكلاء من خلال محاكاة سيناريوهات اتخاذ القرار الأخلاقي، وللمساعدة في اتخاذ القرار من خلال محاكاة تأثير السياسات على المجتمع.
علاوة على ذلك، أشار المؤلف إلى أن هذه المحاكاة قد يكون لها أيضًا مخاطر معينة، بما في ذلك على سبيل المثال لا الحصر: الظواهر الاجتماعية الضارة، والصور النمطية والأحكام المسبقة، وقضايا الخصوصية والأمن، والإفراط في الاعتماد والإدمان.
في نهاية المقالة، يناقش المؤلف أيضًا بعض الأسئلة المفتوحة التطلعية ويقدم بعض الإلهام للقراء للتفكير فيها:
**كيف يمكن للبحث عن العملاء الأذكياء ونماذج اللغات الكبيرة أن يعززوا بعضهم البعض ويتطوروا معًا؟ **أظهرت النماذج الكبيرة إمكانات قوية في فهم اللغة وصنع القرار وقدرات التعميم، وأصبحت دورًا رئيسيًا في عملية بناء الوكلاء، كما أدى تقدم الوكلاء أيضًا إلى طرح متطلبات أعلى للنماذج الكبيرة.
** ما هي التحديات والمخاوف التي سيجلبها الوكلاء المعتمدون في LLM؟ ** إن إمكانية تطبيق العملاء الأذكياء حقًا يتطلب تقييمًا أمنيًا صارمًا لتجنب الإضرار بالعالم الحقيقي. ويلخص المؤلف المزيد من التهديدات المحتملة، مثل: الانتهاكات غير القانونية، وخطر البطالة، والتأثير على رفاهية الإنسان، وما إلى ذلك.
**ما هي الفرص والتحديات التي سيجلبها توسيع النطاق؟ **في مجتمع المحاكاة، يمكن أن تؤدي زيادة عدد الأفراد إلى تحسين مصداقية وأصالة المحاكاة بشكل كبير. ومع ذلك، مع زيادة عدد العملاء، ستصبح مشاكل الاتصال ونشر الرسائل معقدة للغاية، وسيؤدي تشويه المعلومات أو سوء الفهم أو الهلوسة إلى تقليل كفاءة نظام المحاكاة بأكمله بشكل كبير.
**هناك جدل على الإنترنت حول ما إذا كان الوكيل المعتمد على LLM هو المسار المناسب للذكاء الاصطناعي العام (AGI). **يعتقد بعض الباحثين أن النماذج الكبيرة التي يمثلها GPT-4 قد تم تدريبها على مجموعة كافية، والعوامل المبنية على هذا الأساس لديها القدرة على أن تصبح المفتاح لفتح الباب أمام الذكاء الاصطناعي العام. لكن باحثين آخرين يعتقدون أن النمذجة اللغوية التراجعية التلقائية لا تظهر ذكاء حقيقيا لأنها تستجيب فقط. يمكن أن تؤدي طريقة النمذجة الأكثر اكتمالا، مثل النموذج العالمي، إلى الذكاء الاصطناعي العام.
** تطور ذكاء السرب. ذكاء السرب هو عملية جمع آراء العديد من الأشخاص وتحويلها إلى قرارات. **ومع ذلك، هل سيتم إنتاج “الاستخبارات” الحقيقية بمجرد زيادة عدد العملاء؟ بالإضافة إلى ذلك، كيف يمكن التنسيق بين الوكلاء الأفراد لتمكين مجتمع من الوكلاء الأذكياء من التغلب على “التفكير الجماعي” والتحيزات المعرفية الشخصية؟
** الوكيل كخدمة (AaaS). **نظرًا لأن الوكلاء المعتمدين على LLM أكثر تعقيدًا من النموذج الكبير نفسه، ويصعب على المؤسسات الصغيرة والمتوسطة الحجم أو الأفراد بناءهم محليًا، يمكن لموردي الخدمات السحابية التفكير في تنفيذ وكلاء أذكياء في شكل خدمات، أي الوكيل -كخدمة. مثل الخدمات السحابية الأخرى، تتمتع AaaS بالقدرة على تزويد المستخدمين بمرونة عالية وخدمة ذاتية عند الطلب.