من هو الأفضل في استخدام كود كلود؟ الجواب قد لا يكون المبرمجين

العنوان الأصلي: الترميز الوكولي والعودة المستمرة إلى الخبرة
المؤلف الأصلي: Anthropoic
الترجمة: Peggy

المؤلف الأصلي:律动BlockBeats

المصدر الأصلي:

إعادة النشر: مارس فاينانس

مقدمة التحرير: تستند هذه التقرير إلى حوالي 400,000 محادثة مع Claude Code، وتناقش كيف تغير أدوات البرمجة بالذكاء الاصطناعي علاقة الإنسان بالكود.

النتيجة الأساسية في المقالة هي: في برمجة الوكيل الذكي، يحدد الإنسان بشكل رئيسي «ماذا يفعل»، وClaude مسؤول بشكل رئيسي عن «كيف يفعل ذلك». يتحمل المستخدم معظم قرارات التخطيط، بينما يتولى Claude معظم أعمال التنفيذ. بمعنى آخر، يتولى الذكاء الاصطناعي الآن كتابة الكود، تعديل الملفات، تشغيل الأوامر، التصحيح، وغيرها من مراحل التنفيذ، لكن تحديد الأهداف والحكم على النتائج لا يزالان يعتمدان على الإنسان.

الأهم من ذلك، أن فعالية استخدام Claude Code لا تعتمد فقط على ما إذا كان المستخدم مبرمجًا. تظهر التقارير أن معدلات النجاح في المهام التي تتطلب توليد الكود، سواء كان المستخدم في مجالات القانون، المالية، الإدارة، أو البحث العلمي، أصبحت تقارب تلك الخاصة بمهندسي البرمجيات. العامل الحقيقي الذي يؤثر على النتائج هو مدى فهم المستخدم للمشكلة التي يريد حلها.

وهذا يعني أن الذكاء الاصطناعي يخفض عتبة التنفيذ، وليس عتبة الحكم. في المستقبل، قد يكون الأشخاص الذين يفهمون الأعمال، ويفهمون السياق، ويستطيعون تحديد المتطلبات والحكم على النتائج، أكثر قدرة على استخدام الذكاء الاصطناعي بشكل فعال من أولئك الذين يكتبون الكود فقط. لن يحل الذكاء الاصطناعي محل المعرفة الميدانية تلقائيًا، بل سيعزز قيمة المعرفة الميدانية.

وفيما يلي النص الأصلي:

النتائج الرئيسية

استنادًا إلى الدراسات السابقة، اقترحنا إطارًا لدراسة برمجة الوكيل التفاعلي. يعتمد هذا الإطار على تحليل حماية الخصوصية لحوالي 400,000 محادثة مع Claude Code بين أكتوبر 2025 وأبريل 2026، لتقييم تكوين المهام، وأساليب التعاون بين الإنسان والذكاء الاصطناعي، ومعدلات نجاح المهام.

في محادثة نموذجية، يكون الإنسان مسؤولًا عن معظم قرارات التخطيط، أي تحديد «ماذا يفعل»؛ بينما يتولى Claude مسؤولية معظم قرارات التنفيذ، أي «كيف يتم ذلك». كلما زادت خبرة المستخدم في مجال معين، زاد حجم العمل الذي يطلبه من Claude عند إصدار الأوامر. في مهام الترميز، تكاد معدلات النجاح بين المجموعات المهنية الرئيسية — أي مدى إكمالها لما كان ينوي المستخدم القيام به، مع وجود أدلة قابلة للتحقق مثل الاختبارات، وإرسال الكود — تقترب من تلك الخاصة بمهندسي البرمجيات.

كلما زادت خبرة المستخدم في المجال، زادت احتمالية نجاح المحادثة. ومع ذلك، فإن الفارق بين المستخدم المتوسط والخبير ليس كبيرًا جدًا. خلال الأشهر السبعة التي راقبناها، انخفضت نسبة المحادثات التي تستخدم للتصحيح تقريبًا إلى النصف، وتحولت طرق الاستخدام نحو نمط أكثر شمولية: نشر وتشغيل الكود، تحليل البيانات، وكتابة المستندات غير البرمجية.

خلال هذه الفترة، زادت قيمة المهام النموذجية في جميع أنواع الأعمال تقريبًا. قُمنا بتقدير قيمة المهام استنادًا إلى تكاليفها في سوق العمل الحر، مع معايرتها باستخدام بيانات الوظائف العامة الحقيقية. أظهرت النتائج أن متوسط قيمة المحادثة زاد بنسبة حوالي 27% بين أكتوبر وأبريل.

مقدمة

برمجة الوكيل تتطور بسرعة. منذ نهاية 2025، تضاعف عدد المشاريع التي تستخدم الوكلاء البرمجيين في GitHub، ويستخدم مستخدمو Claude Code الآن حوالي 20 ساعة أسبوعيًا على المتوسط. هل يمكن للأشخاص غير المبرمجين أن يوجهوا وكيلًا ذكيًا لإنجاز مهام تقنية معقدة بنجاح؟ وكيف ستؤثر سرعة اعتماد هذه الأدوات وتطور قدراتها على العمل المعرفي الأوسع؟ لا نملك إجابة كاملة بعد، لكن يمكننا ملاحظة بعض الإشارات المبكرة من بيانات استخدام Claude Code.

يعتمد هذا التقرير على تحليل حماية الخصوصية لحوالي 235,000 مستخدم، و400,000 محادثة تفاعلية، لتقديم أدلة على كيفية استخدام Claude Code في الواقع. وهو استمرار لبحثنا السابق حول مؤشرات الاستقلالية في محادثات Claude Code، وكيفية تغييرها لطرق العمل داخل شركة Anthropic. سنقترح إطارًا لوصف استخدام المساعد الذكي التفاعلي: ماذا يعمل الناس، من يقوم بذلك، وهل ينجح العمل. نركز على استخدام Claude Code عبر واجهة سطر الأوامر، أو عبر Claude.ai، أو تطبيق سطح المكتب الخاص بـ Claude Code. من خلال تتبع كيف يتغير نمط استخدام برمجة الوكيل مع تطور قدرات النموذج، يمكننا فهم تأثير هذه الأدوات على محترفي البرمجة وسوق العمل المعرفي بشكل أوسع.

ما يحدث على Claude Code قد يكون مؤشرًا على مستقبل العمل المعرفي: حيث يندمج الوكيل تدريجيًا في الأعمال غير البرمجية. نكتشف أن Claude يتعامل مع مهام أكثر تعقيدًا وقيمة. في الوقت نفسه، لا تزال هناك تقسيمات واضحة للعمل في برمجة الوكيل: الإنسان يحدد ما يُبنى، والوكيل يقرر كيف يُبنى.

كما نرى أدلة على أن العامل الحقيقي في تعزيز فعالية الأدوات هو المعرفة الميدانية، وليس مهارة البرمجة. خاصة، أن الخبراء الميدانيين ينجحون بسهولة أكبر، ويستطيعون التعافي من الأخطاء وسوء الفهم بشكل أسرع. ومع ذلك، فإن الفارق بين المستخدم المتوسط والخبير ليس كبيرًا جدًا، مما يشير إلى أن مجرد إتقان مجال معين يمكن أن يجعل المستخدمين أكثر كفاءة في استخدام هذه الأدوات.

هذه النتائج تتيح لنا ملاحظة التحولات المحتملة في سوق العمل. في بياناتنا، النجاح يعتمد على فهم المستخدم للمشكلة التي يريد حلها، وليس على تدريبه البرمجي. إذا كانت هذه الأنماط صحيحة على مستوى الاقتصاد، فهي تعني أن أدوات برمجة الوكيل قد تستهلك بعض الأعمال التي تعتمد على التنفيذ، لكنها في المقابل تكافئ من يفهم حقًا المشكلة التي يعمل عليها. برمجة الوكيل ليست استبدالًا للمعرفة الميدانية، بل إن فهم المستخدم للمشكلة هو الذي يحدد مدى استفادته من الأداة. كلما زاد فهم المستخدم للمجال، زادت جودة العمل الذي يمكن أن ينجزه الوكيل.

تقسيم العمل

ماذا يفعل الناس باستخدام Claude Code

لفهم كيفية استخدام الناس لـClaude Code، قسمنا كل محادثة إلى واحدة من تسع أنماط عمل، وهي النشاط الذي يصف الهدف الرئيسي للمحادثة بشكل أدق. تتضمن أربعة أنماط مباشرة تتعلق بكتابة أو صيانة الكود: بناء شيء جديد، إصلاح شيء تالف، اختبار الكود، وتنظيم عمل وكيل آخر أو خطوط إنتاج آلية. نمط آخر هو تشغيل البرامج، ويشمل النشر، الإعداد، التشغيل، والمراقبة. هناك نمطان يركزان على فهم «ماذا يجب أن يُفعل»: فهم كيفية عمل نظام موجود، والتخطيط للتغييرات قبل التنفيذ. وأخيرًا، نمطان غير مرتبطين بالكود أو يستخدمان الكود كمساعد: تحليل البيانات، والتواصل عبر العروض التقديمية أو المستندات النصية.

حوالي 56% من المحادثات تتكون من كتابة الكود (25%)، إصلاح الكود (26%)، أو اختبار وتنظيم الكود (5%). تشغيل البرامج يمثل 17%، والتخطيط أو الاستكشاف 14%، وتحليل البيانات أو كتابة النصوص 13% (انظر الشكل 1).

نبدأ بتمرير سجل المحادثة إلى النموذج، ثم نصنف كل محادثة بناءً على النشاط السائد. بعد ذلك، نستخدم أدوات تحليل حماية الخصوصية لمقارنة نتائج التصنيف مع البيانات المجمعة عن بعد، بما يشمل ما إذا كانت هناك إضافة أو حذف لأسطر الكود. تظهر نتائج التصنيفين توافقًا عاليًا، فمثلاً، في المحادثات المصنفة على أنها إنشاء أو تعديل كود، أكثر من 90% منها تظهر تغييرات في الكود في البيانات المجمعة. التفاصيل في الملحق.

من يتخذ القرارات

ما مدى استقلالية Claude Code؟ تُظهر تقييمات القدرات أن الحد الأقصى لقدرتها مرتفع جدًا، وما زالت تتطور. على سبيل المثال، في اختبارات METR، أصبحت النماذج المتقدمة الآن قادرة على إنجاز مهام برمجية كانت تتطلب ساعات من الإنسان، مع قدرتها على التغلب على العقبات ذاتيًا. لكن، كيف تبدو الأمور في الاستخدام الحقيقي؟ هنا، نركز على مدى تحمل الإنسان وClaude مسؤولية التوجيه في المحادثات.

نبحث في الأمر من زاويتين. الأولى، مدى اعتماد الإنسان على اتخاذ القرارات من قبل Claude؛ الثانية، مدى توزيع الأفعال بين الطرفين. لفهم تقسيم القرارات، أنشأنا مصنفًا يعتمد على محتوى المحادثة، ويحدد جميع القرارات المهمة، ويقسمها إلى قرارات تخطيط وقرارات تنفيذ. تشمل قرارات التخطيط: ماذا يُفعل، أي طريقة تُستخدم، وما يُعتبر إنجازًا؛ أما قرارات التنفيذ فتمثل التعديلات على الملفات، كتابة الكود، اختيار اللغة، وتشغيل الأوامر. بعد ذلك، يُنسب كل قرار إلى Claude أو المستخدم، ويُنتج المصنف رقمين: نسبة القرارات التخطيطية التي يتحملها المستخدم، ونسبة القرارات التنفيذية التي يتحملها المستخدم.

بمتوسط، يتخذ الإنسان حوالي 70% من قرارات التخطيط، و20% من قرارات التنفيذ (انظر الشكل 2). في الاستخدام الفعلي، يتضح أن برمجة الوكيل تتبع تقسيم عمل واضح: الإنسان يحدد ما يُبنى، والوكيل يقرر كيف يُبنى.

لفهم مدى تفويض الأفعال خلال المحادثة، لا ننظر إلى المحتوى، بل إلى هيكل المحادثة. تتكون محادثة Claude من تفاعل بين Claude والمستخدم: يرسل المستخدم موجهات، ويقوم Claude بتنفيذ الأفعال؛ ثم يرسل المستخدم موجهًا جديدًا، وهكذا. في المحادثة النموذجية، يكون عدد التكرارات حوالي أربعة. في بياناتنا من أكتوبر إلى أبريل، عند كل موجه يرسله المستخدم، يُفعل Claude حوالي 10 أفعال، وأحيانًا أكثر من 100. في كل جولة، يقرأ Claude الملفات، يعدل الكود، ويشغل الأوامر، ويخرج في المتوسط حوالي 2400 كلمة.

كمية العمل التي ينجزها Claude بين فحصين للمستخدم تعتمد بشكل كبير على من يتخذ القرارات. عندما يحتفظ المستخدم بالسيطرة على عملية التنفيذ، ويقوم باتخاذ أكثر من 80% من قرارات التنفيذ، فإن كل جولة من الأفعال تكون أقل، حوالي 8 أفعال. أما عندما يسيطر Claude على التخطيط، ويقوم باتخاذ أكثر من 80% من قرارات التخطيط، فإن عدد الأفعال التي ينفذها يكون أعلى، حوالي 16 فعلًا.

المستوى المهني

بناءً على كل محادثة، يقيم Claude مستوى خبرة المستخدم الظاهر على مقياس من خمس درجات، من المبتدئ إلى الخبير. يركز مصنف المستوى المهني على ثلاثة إشارات: مدى دقة أوامر المستخدم، ما يطلب من Claude التحقق منه، وما إذا كان المستخدم يصحح Claude أكثر أو العكس. من المهم أن نلاحظ أن هذا المستوى يختلف تمامًا عن الوظيفة أو القدرة العامة، وهو مرتبط بالمهمة المحددة فقط. فمثلاً، مهندس متمرس يسأل عن Rust لأول مرة، يظل مبتدئًا في مهمة Rust. أو محاسب لم يستخدم Python من قبل، إذا استطاع أن يوضح بدقة القواعد التي يجب أن يتبعها سكربت Python معين، ويعرف حدود الأخطاء عند إغلاق الحسابات في نهاية الشهر، فهو خبير في تلك المهمة.

يعرض الجدول أدناه كيف نحدد مستويات الخبرة في المصنف، مع أمثلة من مجموعة بيانات المحادثات المفتوحة مع الوكيل الذكي SWE-chat. المحادثات المصنفة على أنها «مبتدئ» تتضمن أوامر عامة لا تظهر معرفة متخصصة، بينما تلك المصنفة على أنها «خبير» تنقل فهمًا عميقًا للمكتبة التقنية والبيئة التقنية.

قمنا بقياس العلاقة بين مستوى الخبرة، والإنتاجية التي يحققها Claude من كل موجه، وعدد الأفعال. في محادثة مبتدئة نموذجية، يُحفز كل موجه Claude على تنفيذ حوالي 5 أفعال، ويخرج حوالي 600 كلمة؛ أما في محادثة خبير، فإن طول سلسلة الأفعال يتجاوز ضعف ذلك، حوالي 12 فعلًا، والإنتاجية تصل إلى حوالي 3200 كلمة، أي خمس أضعاف. (انظر الشكل 3). يظهر هذا الفارق بين المبتدئ والخبير في كل نوع من العمل وكل فئة من قيمة المهمة.

هذه المقاييس تكمل دراساتنا السابقة حول استقلالية Claude Code. كانت الدراسات السابقة تتابع مدة تشغيل الوكيل، وتكرار الموافقة التلقائية على أفعاله. بالمقابل، تقيس مؤشراتنا على اتخاذ القرارات من هو الذي يتخذ القرارات الجوهرية خلال المحادثة، بينما يُقاس عدد الأفعال والإنتاجية الناتجة عن كل موجه بشري.

من يستخدم Claude Code، ولماذا؟

المستخدمون

لفهم من يقوم بهذه الأعمال، استنتجنا مهنة كل مستخدم من خلال سجل المحادثة، وربطناها إلى أحد 23 فئة مهنية رئيسية وفق تصنيف مكتب إحصاءات العمل الأمريكي (SOC). يُطلب من المصنف أن يعتمد فقط على إشارات مثل سياق المشروع، أسماء الملفات، هيكلها، المراجع التي يستخدمها المستخدم، مثل المستندات القانونية، البيانات السريرية، التقارير المالية، مواد الدورات، والكلمات المفتاحية. يُطلب منه ألا يعتبر «كتابة الكود» بحد ذاته دليلًا على أن المستخدم مبرمج. فقط عندما توجد إشارات واضحة على أن العمل يتطلب مهارات برمجية أو بيانات، يُصنف المحادثة ضمن فئة المهن المرتبطة بالبرمجة، مثل «المهن الحاسوبية والرياضية». على سبيل المثال، إذا كتب محامٍ سكربت للتحقق تلقائيًا من نقص بعض البنود في العقود، فحتى لو كانت المحادثة تتعلق بكتابة الكود، تُصنف ضمن مهن القانون. إذا لم توجد إشارات على مهنة المستخدم، لا يتم التصنيف.

تمكنا من استنتاج مهنة المستخدم في حوالي 70% من المحادثات. من بين تلك التي يمكن تصنيفها، كانت «المهن الحاسوبية والرياضية» أكبر مجموعة، وهو أمر متوقع، لأنها تشمل معظم الأعمال البرمجية. تليها الأعمال التجارية والمالية، والفنون والإعلام، والإدارة، وعلوم الحياة والفيزياء والعلوم الاجتماعية. من بين المجموعات غير البرمجية، كانت أسرعها نموًا هي الإدارة، والمبيعات، والقانون.

العمل

شهدت الفترة من أكتوبر 2025 إلى أبريل 2026 تغيرات ملحوظة في نوعية الأعمال التي يُنجزها الناس باستخدام Claude Code. أبرزها، انخفضت نسبة المحادثات التي تتعلق بإصلاح الكود التالف من 33% إلى 19% (انظر الشكل 4). وارتفعت الأعمال المرتبطة بالتعامل مع الكود بشكل أكبر. نسبة تشغيل البرامج زادت من 14% إلى 21%. وارتفعت كتابة النصوص وتحليل البيانات تقريبًا بمقدار الضعف، من حوالي 10% إلى حوالي 20%.

كما زادت قيمة المهام ذاتها. قمنا بتقدير القيمة الاقتصادية لكل محادثة استنادًا إلى تكاليفها في سوق العمل الحر، مع معايرتها باستخدام بيانات الوظائف الحقيقية. وفقًا لهذا المقياس، زادت القيمة المتوسطة للمحادثة بنسبة حوالي 27% بين أكتوبر وأبريل. وارتفعت قيمة المهام في فئات العمل المختلفة، مثل البناء، التشغيل، والإصلاح، بنسبة تتراوح بين 32% و43%. هذه التقديرات تقريبية، وتستخدم بشكل رئيسي لمقارنة الاتجاهات عبر الزمن، وليس كقيم نقدية مباشرة بالدولار. لمزيد من التفاصيل، انظر الملحق.

النجاح يعتمد على ما يقدمه المستخدم

تقدير قيمة المهام هو وسيلة لفهم كيف يساعد Claude Code الناس على إنجاز أعمالهم. من زاوية أخرى، نراقب مدى نجاح المحادثات، وما هي سماتها التي ترتبط بالنجاح. من بين جميع مؤشرات النجاح، نلاحظ نمطًا واضحًا: كلما زاد مستوى خبرة المستخدم في المحادثة، زادت احتمالية النجاح. غالبية التحسينات تأتي من الانتقال من مبتدئ إلى متوسط، بينما يتباطأ التحسن من متوسط إلى خبير.

قبل تحليل سمات المحادثات الناجحة، نحتاج إلى تعريف دقيق للنجاح. لا يمكننا مراقبة النتائج الواقعية للمستخدمين، ولا يمكننا سؤالهم مباشرة عما إذا كانوا أنجزوا ما يريدون باستخدام Claude. لذلك، نعتمد على طريقتين تكميليتين، تعتمدان على سجل المحادثة. الأولى، «تحديد النجاح»، ويقوم المصنف بعد قراءة كامل سجل المحادثة، بتقييم ما إذا كان المستخدم قد حقق هدفه الأصلي، ويصنف النتائج إلى ناجح، جزئي، فاشل، أو بدون هدف واضح. ثم، يُقيم مصنفان مرفقان مدى قوة الأدلة على النجاح، ويعطيان درجة من 1 إلى 5. أحدهما يبحث عن أدلة على نجاح قابل للتحقق، مثل عمليات git، الاختبارات، أو موافقة المستخدم الصريحة. الثاني يقيم أدلة على الفشل، مثل الأخطاء، فشل الاختبارات، تكرار المحاولة، أو اعتراض المستخدم. النجاح الموثق يتطلب أن يكون هناك دليلان: أن يُصنف المحادثة على أنها ناجحة، وأن يكون هناك على الأقل دليل واحد قوي للتحقق من النجاح. نركز هنا على مدى نجاح أو فشل المحادثة، ونستبعد تلك التي تصنف على أنها «بدون هدف واضح»، والتي تمثل حوالي 7.7% من العينة.

مردود المستوى المهني

أي المحادثات أسهل نجاحًا؟ تظهر نتائجنا أن مستوى خبرة المستخدم يلعب دورًا كبيرًا في النجاح.

قد يتساءل البعض، أن مستوى الخبرة ليس هو العامل الحقيقي. ربما يختار الخبراء مهامًا مختلفة، أو يختلفون في جوانب أخرى. في هذا القسم، نقارن بين محادثات من نفس نوع العمل، ونفس قيمة التقدير، ونفس الشهر، ونفس الموضوع، ومن نفس فئة المهنة، لنرى كيف يؤثر مستوى الخبرة على النتائج.

في جميع مؤشرات النجاح، كلما زاد مستوى خبرة المستخدم، زادت احتمالية نجاح المحادثة. المحادثات المصنفة على أنها «مبتدئ» تحقق نجاحًا في حوالي 15% من الحالات وفقًا لأدق مؤشراتنا، و77% منها على الأقل جزئي. أما تلك المصنفة على أنها «متوسط» أو أعلى، فمعدل النجاح الموثق يتراوح بين 28% و33%، ونجاح جزئي بين 91% و92% (انظر الشكل 5).

في كل مؤشر، غالبية المكاسب تأتي من الانتقال من مبتدئ إلى متوسط، بينما يتباطأ التحسن من متوسط إلى خبير. التفاصيل حول تحليل الانحدار وراء الشكل 5 موجودة في الملحق.

حتى في المحادثات التي تواجه تحديات، نلاحظ نمطًا مشابهًا. عندما يُسجل سجل الفشل أدلة موثوقة على وجود مشكلة، نعتبر أن المحادثة «واجهت مشكلة». قد يشمل ذلك أخطاء، فشل في الاختبارات، تكرار المحاولة، أو استياء المستخدم. في هذه المحادثات، بعد السيطرة على جميع المتغيرات، يرتفع معدل النجاح الموثق من 4% في محادثات المبتدئين إلى 15% في محادثات الخبراء (انظر الشكل 5). وإذا استخدمنا معايير أكثر تساهلاً، فإن نسبة النجاح الجزئي تصل إلى 60% في المستخدمين المبتدئين، و80-81% في المستخدمين المتوسطين والمتقدمين.

كما نتابع علاقة عكسية أخرى، وهي بين مستوى الخبرة ومختلف مؤشرات الفشل. من المهم أن نلاحظ أن المحادثات المصنفة على أنها فاشلة هي تلك التي لم تصل إلى نجاح جزئي على الأقل. إذا كانت المحادثة تواجه مشكلة واعتُبرت فاشلة، ولم تُكتب فيها أي سطر كود، نطلق عليها اسم «تم التخلي عنها». في المحادثات التي يُعتقد أن المستخدم فيها مبتدئ، 19% منها تم التخلي عنها، بينما في الفئات الأخرى، تتراوح النسبة بين 5% و7%. بمعنى آخر، المستخدمون الأقل خبرة أكثر عرضة للتخلي عندما يواجهون صعوبة في تحقيق هدفهم. جزء من قيمة الخبرة هو القدرة على توجيه الوكيل بشكل صحيح.

المهنة قد تكون أقل أهمية من مستوى الخبرة

معدلات النجاح الموثقة للمستخدمين في المهن البرمجية تتراوح حول 30%، بينما غير المبرمجين حوالي 26%. في المحادثات التي تتضمن كودًا، أي تلك التي أُضيف فيها أو غُير سطر كود واحد على الأقل، تصل النسبتان إلى 34% و29% على التوالي (انظر الشكل 6). إذا استخدمنا معايير أكثر تساهلاً، فإن الفارق بين المهن البرمجية وغير البرمجية يتقلص أكثر. في المحادثات التي تتضمن كودًا، تصل نسبة النجاح الجزئي إلى 88-89%، مع فارق بسيط بين المجموعتين، ولم يتغير خلال الأشهر السبعة. في أكبر عشر فئات مهنية في البيانات، يظل الفارق مع مهندسي البرمجيات أقل من 7 نقاط مئوية. أعلى معدل نجاح موثوق به كان للمهن الإدارية، يليه المهن البرمجية. قد يعكس ذلك أن مهارات الإدارة يمكن أن تنتقل إلى قيادة الوكيل، أو أن قياس النجاح يعتمد بشكل جزئي على تأكيد المستخدم الصريح، والذي قد يكون أكثر شيوعًا لدى الإداريين.

آفاق المستقبل

تُظهر نتائج هذا التقرير صورة تتشكل: برمجة الوكيل تعزز بعض المعارف والمهارات، وتستبدل أخرى. في المحادثات التي تتعلق بالكود، فإن معدلات النجاح بين المهن الرئيسية لا تختلف كثيرًا عن تلك الخاصة بالمهن البرمجية. يبدو أن برمجة الوكيل تجعل من غير المهم أن يكون لدى المستخدم خلفية برمجية لتحقيق النجاح.

وفي الوقت نفسه، تظهر المحادثات الناجحة بشكل أكبر معرفة ميدانية. المحادثات التي تصنف على أنها «خبيرة» تحقق نجاحًا موثوقًا أكثر من تلك المبتدئة، بمعدل يتجاوز الضعف. وعندما تواجه المحادثة مشكلة، فإن نسبة استسلام المبتدئين أعلى بكثير من غيرهم. يوضح هذا النمط أن الخبراء الميدانيين يمكنهم توجيه Claude بشكل أكثر فاعلية، باستخدام كل أمر لزيادة العمل المنجز. لذلك، القدرة على توجيه Claude بنجاح تعتمد أكثر على فهم المجال، وليس على كتابة الكود. أي شخص يمتلك فهمًا عمليًا لمجال معين، يمكنه إنجاز مهام تقنية كانت سابقًا تتطلب خبرة عميقة. أما من يفتقر إلى هذا الفهم، فحتى مع نفس الأدوات، ستكون النتائج أقل. والأهم أن الفوائد تأتي من القدرة على الأداء، وليس من التمكن الكامل. فهم المجال بشكل عملي يكفي لتحقيق معظم الفوائد؛ أما التخصص العميق، فسيضيف فقط فوائد إضافية قليلة.

هذه النتائج لا تزال أولية. كما هو الحال مع معظم دراساتنا، لا يمكننا قياس النتائج الواقعية، مثل مدى استخدام الكود الذي يُكتب في النهاية، أو ما إذا كان قد أدى إلى نتائج اقتصادية. بالإضافة إلى ذلك، فإن الاستخدام غير التفاعلي، الذي يمثل جزءًا كبيرًا من النشاط، لم يُدرَس هنا. بناء إطار لقياس هذا النوع من الاستخدام هو أحد أهداف الأبحاث المستقبلية. كما أن جميع تصنيفاتنا تعتمد على قراءة النموذج لسجلات المحادثة. في الملحق، نعرض أن المصنف يتوافق مع البيانات المستقلة بشكل عام، ومع تقييمات مرجعية قوية، في معظم الحالات. لكن، في سيناريوهات واسعة النطاق، لا يزال من الصعب التحقق من صحة المصنف، خاصة وأن محادثات Claude Code قد تكون طويلة ومعقدة، مما يصعب تصنيفها يدويًا كمرجع حقيقي.

مع استمرار تطور النموذج، وتغير أدوار المستخدمين، وتوزيع العمل بين الإنسان والذكاء الاصطناعي، ستظل الصورة التي رسمناها هنا تتغير. نأمل أن تساعد هذه المؤشرات في تتبع التحولات الكبرى: إذا بدأ العائد على مستوى الخبرة في الانخفاض، فذلك قد يدل على أن النموذج بدأ يقدم قرارات حاسمة للمستخدمين، وأن الفوائد ستتوسع من الخبراء إلى جمهور أوسع. وإذا استمر نجاح المستخدمين غير المبرمجين في إنجاز محادثات برمجية، فربما يعني ذلك أن إنتاج البرمجيات أصبح جزءًا من الأعمال العادية في مختلف المجالات، وليس مقتصرًا على مهنة واحدة. هذه التحولات ستؤثر على من يستفيد من برمجة الوكيل، ومدى استفادتهم، وستغير القدرات الأكثر أهمية في سوق العمل.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت