دراسة أنثروبيك: التخصص في المجال يحدد بشكل أكبر فعالية توليد كود كلود من قدرات البرمجة

تحليل أنثروبيك لقرابة 400 ألف جلسة تفاعل مع Claude Code، وحوالي 235 ألف مستخدم، كشف أن العامل الحاسم في نجاح أو فشل البرمجة بواسطة الذكاء الاصطناعي ليس مدى إتقان كتابة الكود، بل مدى فهم المجال الذي يُحلّ فيه المشكلة.
(مقدمة: أنثروبيك أطلقت لوحة تحكم تأثير الذكاء الاصطناعي: أدخل مهنتك، وتحقق في ثوانٍ كم من عملك يُستهلك بواسطة الذكاء الاصطناعي؟)

فهرس المقال

تبديل

  • كيف يصبح المحاسب "خبيرًا" في نظر Claude
  • بعد الخطأ، من يستطيع إعادة الوكيل إلى المسار الصحيح
  • الإدارة تتفوق على مهندسي البرمجيات، والفروق المهنية تكاد تتلاشى

في أحدث تقاريرها، حلّلت أنثروبيك حوالي 235 ألف عينة من المستخدمين، واكتشفت أن العامل الحقيقي الذي يحدد نجاح أو فشل أداء الذكاء الاصطناعي هو مدى فهم الشخص الذي يعطي الأوامر للمشكلة التي يحلها.

كيف يصبح المحاسب "خبيرًا" في نظر Claude

شملت عينة دراسة أنثروبيك من أكتوبر 2025 إلى أبريل 2026، حوالي 400 ألف جلسة مع Claude Code.

أنشأت الدراسة مقياسًا مخصصًا لمستوى الاحتراف من خمس درجات، من المبتدئ إلى الخبير. والسر يكمن في تعريف "الاحتراف" الذي يختلف عما قد تتوقعه. ببساطة:
مدى فهمك للمشكلة التي تحلها، وليس مدى براعتك في كتابة الكود.

أعطت الدراسة مثالاً واضحًا:
مهندس برمجيات مخضرم يكتب لأول مرة بلغة Rust، يُعتبر مبتدئًا في تلك المهمة؛
وعلى العكس، محاسب لم يستخدم Python من قبل، فقط إذا استطاع أن يوضح بدقة لClaude قواعد التسوية، ويحدد الأخطاء المنطقية عند إغلاق الحسابات، يُعتبر خبيرًا في تلك المهمة.

الفرق في الأرقام يوضح مدى خطورة المشكلة.
جلسات المبتدئ تتطلب في المتوسط حوالي 5 أوامر من Claude، وتنتج حوالي 600 كلمة؛
أما جلسات الخبير فتتطلب حوالي 12 أمرًا، وتنتج حوالي 3,200 كلمة، أي ضعف الأوامر وخمسة أضعاف النص الناتج مقارنة بالمبتدئ.

تحليل أنثروبيك الانحداري أظهر أن كل ترقية لمستوى الاحتراف تزيد من عدد أوامر Claude بنسبة حوالي 9%، وتزيد من حجم المخرجات بنسبة حوالي 13%.
وهذا يظل صحيحًا حتى بعد السيطرة على نوع العمل، قيمة المهمة، الشهر، المهنة، وإصدار النموذج.

بعد الخطأ، من يستطيع إعادة الوكيل إلى المسار الصحيح

الأرقام المتعلقة بمعدلات النجاح توضح الأمر أكثر.
حددت أنثروبيك معيارين للنجاح:

  • "تحديد النجاح" (حيث يقرر المصنف بعد قراءة الحوار ما إذا تم تحقيق الهدف)
  • "التحقق من النجاح" (وهو وجود أدلة قابلة للفحص، مثل الاختبارات، التعديلات على Git، أو تأكيد المستخدم بشكل واضح).

بشكل عام، كلما زادت درجة احترافية المستخدم، زادت احتمالية نجاح الجلسة، وغالبًا ما يكون الارتفاع أكبر في المستويات الأدنى، حيث يفرق الفارق بين المبتدئ والمتوسط أكبر من ذلك بين المتوسط والخبير.
اكتشفت أنثروبيك أن معدل التحقق من النجاح في جلسات الخبير يتجاوز ضعف معدل المبتدئ.

الأمر الأكثر إثارة هو "معدل الإصلاح بعد الخطأ".
تابعت أنثروبيك تلك الجلسات التي واجهت مشاكل، أي التي أظهرت إشارات فشل.
وفي هذه الجلسات، ارتفع معدل التحقق من النجاح من 4% عند المبتدئ إلى 15% عند الخبير؛
أما نسبة النجاح الجزئي، فهي 60% للمبتدئ، و80-81% للمتوسط والخبراء.

الفارق في معدل التخلي عن الجلسة واضح أيضًا.
عندما تواجه الجلسة مشكلة، يختار المبتدئ التخلي مباشرة بنسبة 19% (أي فشل القرار وبدون أي كود)،
بينما المستويات الأخرى تتراوح بين 5-7%.
تفسير أنثروبيك هو أن أحد فوائد التخصص في المجال هو القدرة على إعادة توجيه الوكيل عندما يخرج عن المسار الصحيح.

وهذا يقود إلى استنتاج غير بديهي:
"فهم المشكلة" أهم من "فهم الأدوات".
لأن من يفهم المشكلة جيدًا، يعرف أين الخطأ عندما يعطيه Claude إجابة خاطئة؛
ويستطيع تحديد الحدود بدقة؛
ويتمكن من التصحيح فورًا عندما يتخذ الوكيل قرارات غريبة.

الإدارة تتفوق على مهندسي البرمجيات، والفروق المهنية تكاد تتلاشى

كشفت بيانات أنثروبيك عن مفاجأة أخرى:
الخلفية المهنية ليست مهمة كما كان يُعتقد.

معدل نجاح التحقق في الوظائف المرتبطة بالبرمجة حوالي 30%، بينما في الوظائف الأخرى حوالي 26%.
عند النظر فقط إلى الجلسات التي تتضمن إنتاج كود برمجي فعلي، يزداد الفرق إلى 34% مقابل 29%.
لكن عند توسيع المعايير ليشمل "جزئيًا على الأقل"، تصبح النسب متقاربة جدًا: 89% مقابل 88%.

الأكثر إثارة هو أن العشرة وظائف الأعلى تصنيفًا، كل واحدة منها تقع ضمن 7 نقاط مئوية من معدل نجاح المبرمجين.
حتى أن الإدارة تتفوق قليلاً على المبرمجين، وفقًا لتوقعات أنثروبيك، لأنها معتادة على تفويض المهام وتحديد المواصفات، وهو ما ينقل بشكل جيد إلى توجيه الوكيل.

أما نمط العمل نفسه، فقد شهد تطورًا سريعًا خلال سبعة أشهر.
نسبة جلسات تصحيح الأخطاء انخفضت من 33% إلى 19%، أي تقريبًا إلى النصف؛
واستخدام البرمجيات (النشر، الإعداد، تشغيل خطوط الأنابيب) ارتفع من 14% إلى 21%؛
أما الكتابة والتحليل البيانات فارتفعت من حوالي 10% إلى 20%.

بمعنى آخر، المستخدمون يستخدمون Claude Code بشكل متزايد في الأعمال "الجانب البرمجي" وليس فقط في كتابة الكود نفسه.

كما أن القيمة الاقتصادية للمهمات ارتفعت أيضًا.
قدر أنثروبيك قيمة كل جلسة في السوق بناءً على أسعار العمل الحر، وارتفعت خلال السبعة أشهر بنسبة حوالي 27%؛
والمهام الإنشائية زادت بنسبة حوالي 43%، والمهام التشغيلية بنسبة 34%، والمهام التصحيحية بنسبة 32%.

في نهاية التقرير، طرحت أنثروبيك إطارًا مفيدًا للتذكر:
الربح يأتي من "الكفاءة، وليس الإتقان"، بمعنى أن "التحكم الكافي" يكفي، ولا حاجة إلى إتقان عميق.

فهم مجال معين بشكل أساسي أو متوسط يكفي لتحقيق معظم الفوائد؛
أما من يتقدم من المستوى المتوسط إلى الخبير، فإن معدل النجاح يتسطح بشكل ملحوظ.

ومع استمرار توسع أدوات الذكاء الاصطناعي، فإنها تبرز ليس مهارات البرمجة، بل عمق فهمك للمشكلة.
فمن لا يفهم ما يحل، حتى مع نماذج أقوى، يظل يضيع بسرعة أكبر.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت