تفسير العمل الجديد لـ Anthropic: كيفية بناء فرق تعاون فعال بين الذكاء الاصطناعي والبشر

في 24 يونيو، نشرت مدونة Anthropic الرسمية مقالًا جديدًا بعنوان "بناء فرق فعالة بين الإنسان والوكيل"، بقلم كريستن سوانسون.

جوهر المقال يدور حول نقلة في نموذج التعاون على مستوى الفرق في الذكاء الاصطناعي، من "شخص واحد يتحدث مع صندوق دردشة واحد (حتى لو كان وراءه العديد من الوكلاء)" إلى "مجموعة من البشر ومجموعة من الوكلاء يشاركون نفس مساحة العمل".

سيقوم كاتب هذا المقال، بناءً على نقل الأفكار الأساسية للمقال الأصلي، مع دمج الخبرة العملية في نشر وكلاء الذكاء الاصطناعي، بتقديم تحليل هيكلي وتفكير شامل.

**أولاً: الموضوع الرئيسي: فرق التعاون في الذكاء الاصطناعي تتحول إلى "وضع متعدد اللاعبين"

في الماضي، كان استخدام الذكاء الاصطناعي تجربة "لاعب واحد" - شخص واحد يتعاون مع وكيل لإكمال المهام الشخصية.

أما الآن، فالنموذج الجديد هو أن البشر والوكلاء يمكنهم التعاون في نفس مساحة العمل، لخدمة هدف مشترك للفريق.

أصبح العمل更像 "لعبة متعددة اللاعبين": فريق بشري يضع الاستراتيجية، وكلود ينفذ.

باختصار، هو مشاركة الهدف، مشاركة السياق، والأهم مشاركة مساحة العمل.

كما هو موضح في الشكل أدناه، يحدث تحول نحو نمط العمل الأكثر تعقيدًا على اليمين:

ما يحقق هذا التحول هو منتج Anthropic الجديد Claude Tag، وهي شكل يتيح لكلود التواجد في أدوات التعاون الجماعي مثل Slack، ويتم مناداته بـ @ وتكليفه مثل أي عضو في الفريق.

لذا، هذه المقالة ليست نظرية بحتة، بل هي "الاتجاه الذي تدفعه منتجات Anthropic نفسها".

ثانيًا: ما هي مشكلة التعاون بين "الوكلاء المتعددين" بين البشر؟

يعرّف المقال الأصلي "الوكلاء متعددي اللاعبين" على أنهم: نماذج ذكاء اصطناعي تتعاون في وقت واحد مع العديد من البشر المختلفين.

لديهم أوجه تشابه مع الوكلاء العاديين الذين نعرفهم، ولديهم أيضًا اختلافات جوهرية:

  • التشابه: لديهم ذاكرة ومهارات خاصة بهم.

  • الاختلاف: لديهم بيانات اعتماد خاصة بهم،

وهم "يعيشون حيث يحدث العمل" - يعيشون في المكان الذي يحدث فيه العمل الحقيقي.

في Anthropic، ذلك المكان هو أدوات التعاون الجماعي مثل Slack.

هذا الإعداد "لديه بيانات اعتماد خاصة به، ويعيش في قنوات الفريق" مهم جدًا.

يعني أن الوكيل لم يعد يستعير حساب شخص ما، أو يعمل في محادثة خاصة بشخص ما، بل هو كيان فريق مستقل له هوية خاصة: يمكن رؤيته من قبل الفريق بأكمله، ومخرجاته مرئية للجميع، والسياق الذي يقرؤه هو على مستوى الفريق وليس على مستوى فردي. كما هو موضح في الشكل أدناه، يصبح عضوًا في برنامج العمل.

لجعل الوكيل قادرًا على "المشاركة بفعالية" في قنوات الفريق، نحتاج إلى مجموعة من القدرات الأساسية (مثل شكل منتج Claude Tag) + ذاكرة دائمة مصممة خصيصًا، وهوية حصرية، ومصادر معلومات، وما إلى ذلك.

بالإضافة إلى ذلك، لا يكفي امتلاك القدرات التقنية فقط، بل لنجاح الفريق البشري الآلي، نحتاج إلى مجموعة من أساليب العمل والمعايير المشتركة.

لذا، فإن النقاط الأربع التالية في المقال تتحدث جميعها عن تجارب في تصميم "معايير" فريق الذكاء الاصطناعي.

ثالثًا: أربع تجارب لفرق وكلاء الذكاء الاصطناعي

التجربة الأولى: إصلاح إدارة المعلومات، وإعطاء الوكيل أوسع سياق ممكن

تعتقد Anthropic أنه لا ينبغي تحديد المعلومات التي يمكن للوكيل رؤيتها مستندًا تلو الآخر وقناة تلو الأخرى، بل يجب استخدام حدود أمنية محددة بوضوح تعمل بشكل قطعي على مساحة عمل Slack بأكملها، ونسخ الاجتماعات، ومكتبات المستندات.

يشير المقال الأصلي بشكل خاص إلى العذاب اليومي: "هل يجب أن تكون هذه القناة عامة أم خاصة؟ هل يمكن مشاركة هذا المستند مع ذلك الشخص؟ هل يمكن لهذا الوكيل رؤية تلك الرسالة؟"

يجب أنه ضمن الحدود، يكون السياق مرئيًا لكل عضو في الفريق - سواء كان بشريًا أو ذكاءً اصطناعيًا، بل ويمكن للذكاء الاصطناعي أن يطلب صلاحية الوصول إلى المستندات مثل البشر.

تكمن روعة هذه الطريقة في أنها تحل مشكلتين في وقت واحد:

  1. توسيع السياق الذي يمكن للوكيل والبشر الحصول عليه؛

  2. القضاء على "إرهاق اتخاذ القرار" الناتج عن المشاركة الفردية.

عائد فتح الصلاحيات حقيقي، فلا مزيد من فقدان المعلومات في النقل، ولأن سرعة قراءة الوكيل للنصوص تفوق البشر بكثير، يمكنهم "بشكل روتيني إظهار الأعمال ذات الصلة التي كان البشر ليفوتوها".

يرى الكاتب أن هذا في جوهره تحول في ثقافة المنظمة وآليات الصلاحيات.

"الشفافية الداخلية الافتراضية" هي تغيير ثقافي صعب على العديد من الشركات.

لأن Anthropic كانت منذ البداية شركة عالية الثقة، معلومات مسطحة، لذلك لا يمكنها فهم أمراض الشركات الكبيرة، خاصة في الصناعات التقليدية، حيث يشكل تفاوت المعلومات بين المستويات فجوة في الموارد.

وبالنسبة للعديد من المنظمات ذات الامتثال الصارم وعزل المعلومات الصارم (المالية، الطبية، عبر الولايات القضائية)، قد لا يكون "القطع على مستوى مساحة العمل" ممكنًا.

لذا فإن ما يمكن تطبيقه حقًا هو آلية الموافقة المبسطة وراء ذلك، مثل أن الوكيل بمجرد وجوده في مجموعة، يمكنه قراءة المستندات التي لها صلاحية في تلك المجموعة بشكل طبيعي، حتى مع وجود إدارة صلاحيات، يمكن إدارتها بشكل جماعي بدلاً من منح المستندات أولاً ثم الترتيب للجودة.

التجربة الثانية: كل شخص / وكيل له دور وأدوات واضحة

صورة المقال قوية جدًا: الفريق البشري الآلي يشاركون قائمة أعضاء واحدة، ومجموعة منتجات واحدة، ومساحة عمل واحدة.

فوق ذلك، لكل وكيل تخصصه:

  • وكيل لديه تحليل بيانات مشروع معين؛

  • آخر يحمل وينفذ المعايير التصميمية؛

  • ثالث مسؤول عن توليف البحث.

عند بدء المشروع، يتحدث البشر أولاً مع الوكيل، ويقررون كيفية توزيع الأدوار، وكيف سيتعاون البشر والوكلاء.

ثم ينتج عن ذلك مجموعة من الأدوار والقواعد + توقيت التدخل كما في الشكل أدناه.

بعد تحديد الأدوار، يمكن لوكيل واحد حتى أن "يُشغل" وكلاء آخرين، لضمان أن كل مهمة محددة تُسلم للوكيل الذي لديه الذاكرة الصحيحة، وصلاحية الوصول الصحيحة.

المفتاح هو توفير الأدوات الكاملة: الوكيل الذي يقوم بتحليل البيانات قد يحتاج إلى صلاحية الوصول إلى BigQuery، والوكيل الذي يقوم بضمان الجودة قد يحتاج إلى Playwright MCP.

يحتفظ البشر بالأدوار التي يمكن للبشر فقط القيام بها، لضمان استخدام الحكم البشري في أهم القرارات.

يرى الكاتب: هذه هي أيضًا بنية آلية العمل التي درستها Anthropic سابقًا.

استخدام وكيل قائد لتنسيق الكل، وتفويض المهام لوكلاء فرعيين متخصصين يعملون بالتوازي. هذه الآلية عملية حقًا، ومؤشرات الجودة تتضاعف تقريبًا (أعلى بنسبة 90.2%)، على الرغم من زيادة تكلفة الرموز بمقدار 15 ضعفًا. ومع ذلك، فإن "الوكلاء المتعددين أقوى" ليس استنتاجًا عامًا، بل هو "تحسن في نوع معين من المهام، مقابل تكلفة حسابية كبيرة".

خاصة في الأعمال ذات الأولوية للعرض، والقابلة للتوازي، وبسبب آلية التحقق المتبادل الأقوى، تكون دقة المعلومات أفضل.

ويجب أيضًا تصميمها بدقة، مع تحليل المهام وعزل الأدوار، وليس مجرد "تكديس عدة وكلاء".

وإلا ستكون مرة أخرى سوء فهم من الجيل الجديد.

هذه الأفكار موجودة أيضًا في المقال السابق حول كيفية استخدام Claude's Dynamic Workflows للبحث العميق.

التجربة الثالثة: تحديد دور نجم الشمال، وجعل الوكيل يحل المشاكل بنشاط

يميز المقال الأصلي بين نوعين من الوكلاء: نوع يكتفي بـ "إكمال المهام الموكلة إليه"، بينما النوع الأكثر أهمية هو الذي يقترح مشاريع وسير عمل جديدة بنشاط.

عادة ما يظهر الأخير في فريق لديه بالفعل سياق غني وأدوار واضحة، مع توجيه إضافي - نجم الشمال (north star).

نجم الشمال مسؤول عن مساعدة الفريق في الحكم على "أي المهام وسير العمل هي الصحيحة".

يؤكد المقال على عدة قواعد:

يتم تعيين نجم الشمال دائمًا بواسطة البشر، ويكون متجذرًا في مهمة الشركة وأهداف العمل؛

• بمجرد كتابة نجم الشمال بوضوح، يشاركه البشر مع وكلاء الفريق؛

• ثم - وهذه خطوة حاسمة - يختار البشر أي الوكلاء يجب أن يقترحوا سير عمل جديدة بنشاط.

افترض وجود شركة ومنتج يقودهم العمليات، فيجب أن يكون دور العمليات هو الوكيل الرئيسي، وليس المنتج أو التكنولوجيا أو المالية.

مثل نمط التوجيه (Classify-And-Act) في كيفية استخدام Claude's Dynamic Workflows للبحث العميق، حيث يقوم وكيل أول بتصنيف نوع المهمة، ثم توزيع المهمة على الوكيل المتخصص الأنسب.

يرى الكاتب، أنه في العديد من مقالات Anthropic السابقة، كان هناك تمييز واضح في نظرتهم لما هو وكيل وما هو سير عمل؟

الأول: "يدير عملياته واستخدام أدواته بشكل ديناميكي، ويتحكم في كيفية إنجاز المهمة".

والثاني: نظام حتمي يتم "تنسيقه عبر مسارات كود محددة مسبقًا".

لذا، لبناء فريق ذكاء اصطناعي، يجب إعطاء الوكيل نجم شمال بدلاً من قائمة مهام، وهذا هو دفع النظام بوعي من سير العمل نحو الوكيل.

فريق لديه هدف سيجلب بعض الإبداع، بدلاً من البحث عن شيء لفعله في نطاق محدود.

بالطبع، العديد من فرق الذكاء الاصطناعي التي نبنيها الآن هي في الواقع برمجية أو سير عمل ذكي، وهذا يحل بالفعل العديد من المشاكل. إذا كنا نحتاج لاحقًا إلى الإبداع، والتحفيز الذاتي، والقدرة على حل المشاكل بنشاط، فيجب علينا تصميم مثل هذا الفريق الوكيل.

التجربة الرابعة: جعل الوكيل ينمو بمرور الوقت

هنا، فاجأني الرقم الرسمي كثيرًا، حيث قال: مهندسو Anthropic جعلوا الوكيل في الفريق قادرًا على معالجة 500 إصلاح للثغرات بشكل مستقل - لكنه أكد على الفور: "الأمور بالتأكيد لم تبدأ بهذا الشكل".

يشبه الوكيل بزميل بشري جديد: يحتاج إلى جولات متعددة من التغذية الراجعة لإظهار المعرفة الضمنية مثل "كيفية أداء المهمة بأفضل طريقة".

يجب على المستخدم اختبار الوكيل مرارًا وتكرارًا بمهام مختلفة لفهم حدود قدراته، وكيفية وصف الأهداف بوضوح، وما هي ملفات المهارات التي يحتاجها، وأي تعليمات تؤدي إلى السلوك المرغوب.

يحذر المقال الأصلي بشكل خاص من نقطة غالبًا ما يتم تجاهلها: النموذج سيتطور، والمهام يجب اختبارها مرة أخرى - قد تحتاج التعليمات إلى إعادة كتابة، والقيود (Harness) التي كانت مفيدة في الماضي قد تعيق نموذجًا أكثر ذكاءً من البحث عن حلول أكثر إبداعًا.

أغنى جزء في هذه التجربة هو النقاش حول التحقق (verification):

وجدنا أن أفضل الوكلاء على المدى الطويل، قبل تسليم عملهم للبشر، لديهم طرق متعددة للتحقق من عملهم.

  • الكود لديه اختبارات، هذا أمر طبيعي؛

  • ولكن معظم الأعمال الأخرى يمكن التحقق منها أيضًا: المستندات التقنية يمكن تقييمها باستخدام معايير التقييم (rubric) ودليل الأسلوب (style guide)؛

  • عندما يحدد البشر المعايير ويضمنون أن جميع الأعمال المسلمة للوكيل يمكن مراجعتها، يمكن الحفاظ على الجودة وعدم الانحراف عن الهدف؛

  • بالإضافة إلى ذلك، يمكن جعل وكيل يعمل ووكيل آخر يفحص - هذا هو ما يسمى بـ "Doer-Verifier" (المنفذ - المدقق) harness للوكيل.

يحتوي المقال الأصلي على مثال كامل: مهندس مسؤول يتولى فريقًا جديدًا مثقلًا بالتراكمات (backlog)، استدعى بعض البشر + بعض الوكلاء لترتيب الأولويات معًا.

مجموعة من الوكلاء قرأت جميع التراكمات، وحكمت ما إذا كان هناك من يعمل عليها، وأعطت درجات تعقيد للعناصر غير المملوكة؛

مجموعة أخرى قامت بتصفية العناصر ذات التعقيد المنخفض والمتوسط من القائمة، وأنتجت تغييرات في الكود مباشرة.

في البداية، كان البشر يراجعون كل قرار يتخذه الوكيل، ويضعون علامة على تلك التي تحتاج تدخل بشري؛ ثم، "علم" البشر الوكيل أن يرفع مثل هذه القرارات مباشرة إلى البشر، لضمان أن القرارات ذات المقايضات الصعبة يكون فيها دائمًا "إنسان في الحلقة".

وأسبوعيًا، كان الفريق يجعل الوكيل يعد تقريرًا أسبوعيًا يتضمن "الدروس والأخطاء (lessons & missteps)"، ليتذكر الوكيل الأخطاء ويتجنب تكرارها. بمرور الوقت، أصبح المسؤول قادرًا على تكليف الوكيل بتغييرات أكثر تعقيدًا، بينما يقل الوقت الذي يقضيه في التوجيه اليومي، كما هو موضح في الشكل أدناه:

يشبه إلى حد كبير عملية تربية جراد البحر الذكي.

الفقرة الأخيرة هي أكثر ما أعجبني في المقال بأكمله - عندما أصبح الوكيل أكثر استقلالية، بدأ المسؤول في تعليم الوكيل أن يعامل "انتباه الإنسان" كمورد نادر:

مثل تجميع المشكلات، للسماح للبشر بالإجابة مرة واحدة، وتكرار السياق المهم، ليدخل البشر في الحالة بسرعة، وتحديد عدد الأمور التي تُرمى للبشر في وقت واحد.

بعض الأشخاص قاموا حتى بإعداد وكيل خاص، مهمته الوحيدة هي تحديد كيفية التجميع، ورفع أهم الاتصالات فقط إلى البشر.

آخرون وضعوا حاجزًا للوكيل مثل "الحد الأقصى للعمل الذي يمكن القيام به يوميًا" - حتى يتمكن البشر من المشاركة بشكل هادف، والحفاظ على المهارات المهمة لديهم من الضياع.

يرى الكاتب أن هذه التجارب هي أعمق ما في المقال فيما يتعلق بـ "العلاقة بين الإنسان والآلة".

  • أولاً، في فكر Anthropic: الإشراف الفعال ليس الموافقة على كل إجراء، بل هو "التواجد في موقع يمكنه من التدخل في اللحظات الحاسمة".

  • ثانيًا، التعامل الصريح مع "انتباه الإنسان" كمورد نادر لتحسينه هو مبدأ تصميم تم الاستهانة به بشدة. معظم النقاشات حول الوكلاء تركز على تحسين "قدرات الوكيل"، بينما الاختناق الفعلي للكفاءة هو بالفعل "عرض النطاق الترددي المعرفي للإنسان".

  • ثالثًا، هندسة Harness يجب أن تحاكي في الفريق الآلي البشري طريقة الفرق الفعالة، لأن بعض الخيول الجيدة لا تحتاج حقًا إلى لجام، بل إلى هدف فقط.

رابعًا: عصر التعاون بين الإنسان والآلة سيكشف بلا رحمة عن الجودة التنظيمية الأصلية للفريق

الجملة الأكثر صدقًا والأكثر سهولة في التغاضي عنها في هذه المقالة تظهر في النهاية:

يقول إن هذه التجارب الأربع المذكورة أعلاه ليست جديدة في الواقع، كانت موجودة قبل ظهور الذكاء الاصطناعي، الفرق الجيدة تحتاج إلى نجم شمال قوي، وأدوار واضحة، ووثائق صلبة، ومعايير جودة مشتركة، ومساحة للتعلم من الأخطاء، كلها عادات صحية للفرق نعرفها منذ عقود.

وفريق الوكيل للذكاء الاصطناعي يجعل هذه الأساسيات أكثر أهمية.

بدون بناء آلية معقولة، لن يجعل الذكاء الاصطناعي الفريق أقوى تلقائيًا، بل قد يسبب ضغطًا، ويؤدي في النهاية إلى الفوضى، مثل:

  • الفرق ذات السياق المتناثر (مثل تلك التي تعتمد على فجوات المعلومات لإدارة)، بعد إدخال الوكلاء ستصبح أكثر تشتتًا (كلما زاد عزل المعلومات، زاد انحراف المخرجات)؛

  • الفرق ذات الأدوار غير الواضحة، سيقوم الوكلاء فقط بنسخ الفوضى، وتداخل مسؤوليات العمل، وتشويه مصدر الحكم للمتخذين للقرار.

  • الفرق التي ليس لديها ثقافة تحقق، ستتضخم أخطاء الوكلاء بسرعة أكبر، سرعة كود الذكاء الاصطناعي تجاوزت بكثير سرعة مراجعة الكود البشري.

  • لذلك،

يرى الكاتب، "الفرق التي ستجني أكبر استفادة من موجة الوكلاء الحالية هي تلك التي تمارس هذه الأساسيات بوعي أكبر."

بالنسبة للمنظمات التي تراهن على وكلاء الذكاء الاصطناعي، فإن الواجب الحقيقي الذي تقدمه هذه المقالة قد لا يكون في "كيفية استخدام Claude"، بل في العودة ومراجعة هذه الأمور الأربعة القديمة - السياق، الأدوار، الأهداف، ومعايير الجودة - بجدية وإعادة بنائها من الصفر.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت