ماذا يفعل وكيل الذكاء الاصطناعي حقًا؟ تحليل كامل لتسريب 500,000 سطر من رمز كلود كود

51.2 ألف سطر من الكود، 1906 ملفات، و59.8 ميغابايت من source map. في فجر 31 مارس، اكتشف Chaofan Shou من Solayer Labs أن المنتج الرائد لدى Anthropic، Claude Code، قد كشف عن كامل الكود المصدري في مستودع npm عام. خلال بضع ساعات، تم نسخ الكود إلى GitHub، وتجاوز عدد عمليات fork 4.1 آلاف.

هذه ليست المرة الأولى التي يرتكب فيها Anthropic هذا الخطأ. عند صدور Claude Code لأول مرة في فبراير 2025، حدث تسريب مماثل لنفس source map. رقم النسخة هذه المرة هو v2.1.88، وكان سبب التسريب نفسه: أداة البناء Bun تولّد source map افتراضيًا، لكن ملف .npmignore كان ينقصه هذا الملف.

معظم التقارير ركزت على بيض عيد الميلاد داخل التسريب، مثل نظام الحيوانات الأليفة الافتراضي، و«وضع التسلل» الذي يسمح لـ Claude بإرسال كود للمشاريع مفتوحة المصدر بشكل مجهول. لكن السؤال الذي يستحق التفكيك فعلاً هو: لماذا يختلف أداء نفس نموذج Claude كثيرًا بين النسخة على الويب وClaude Code؟ ماذا يفعل بالضبط 51.2 ألف سطر من الكود؟

النموذج مجرد غيض من فيض

توجد الإجابة في بنية الكود. وفقًا لتحليل انعكاسي للكود المصدّر المُسرّب أجراه مجتمع GitHub، فإن حوالي 8000 سطر من TypeScript من أصل 51.2 ألف سطر، هي فقط الأكواد المسؤولة مباشرة عن استدعاء واجهات نموذج الذكاء الاصطناعي، أي 1.6% من الإجمالي.

فيمَ تعمل باقي 98.4%؟ أكبر وحدتين هما محرك الاستعلامات (46 ألف سطر) ونظام الأدوات (29 ألف سطر). يتولى محرك الاستعلامات معالجة استدعاءات LLM API، والإخراج التدريجي، وتنظيم التخزين المؤقت، وإدارة المحادثات متعددة الجولات. يعرّف نظام الأدوات حوالي 40 أداة مدمجة و50 أمرًا باستخدام صيغة slash، مكوّنًا بنية شبيهة بالإضافات؛ ولكل أداة تحكم مستقل في الصلاحيات.

بالإضافة إلى ذلك، توجد 25 ألف سطر لكود واجهة المستخدم الطرفية (ومنها ملف اسمه print.ts بطول 5594 سطرًا، وتجاوز طول دالة واحدة 3167 سطرًا)، و20 ألف سطر للتحكم في الأمان والصلاحيات (يشمل 23 فحصًا أمنيًا لأوامر Bash مرقمة و18 أمرًا مدمجًا في Zsh تم حظرها)، و18 ألف سطر لنظام تنسيق الوكلاء المتعددين.

أشار الباحث في أبحاث التعلم الآلي Sebastian Raschka، بعد تحليل الكود المُسرّب، إلى أن قوة Claude Code مقارنة بنسخة الويب لنفس النموذج لا تكمن في النموذج نفسه، بل في «الهيكل/السقالة البرمجية» المبني حول النموذج، بما في ذلك تحميل سياق المستودع، وجدولة الأدوات المخصصة، واستراتيجيات التخزين المؤقت، وتعاون الوكلاء الفرعيين. وحتى إنه يرى أنه إذا تم تكييف نفس بنية الهندسة على نماذج أخرى مثل DeepSeek أو Kimi، فقد نحصل أيضًا على تحسين قريب من أداء البرمجة.

يمكن أن يساعدك مقارنة مباشرة على فهم هذا الفرق. عندما تطرح سؤالًا على ChatGPT أو Claude عبر النسخة على الويب، يعالج النموذج السؤال ثم يعيد الإجابة، وبعد انتهاء المحادثة لا يترك شيئًا. لكن طريقة Claude Code مختلفة تمامًا: عند التشغيل، يقرأ أولاً ملفات مشروعك، ويفهم بنية قاعدة الكود لديك، ويتذكر تفضيلك الذي قلته آخر مرة مثل «لا تقم بعمل mock لقاعدة البيانات في الاختبارات». يمكنه تنفيذ الأوامر مباشرة في طرفيتك، وتحرير الملفات، وتشغيل الاختبارات، وعند مواجهة مهام معقدة يقوم بتقسيمها إلى عدة مهام فرعية وتوزيعها على وكلاء فرعيين مختلفين لمعالجتها بالتوازي. وبعبارة أخرى، فإن ذكاء النسخة على الويب هو «نافذة أسئلة وأجوبة»، بينما Claude Code هو «مساعد يعيش داخل جهازك».

قارن بعضهم هذه البنية بنظام تشغيل: 42 أداة مدمجة تشبه نداءات النظام، ونظام الصلاحيات يشبه إدارة المستخدمين، وبروتوكول MCP يشبه برامج تشغيل الأجهزة، وتنسيق الوكلاء الفرعيين يشبه جدولة العمليات. عند إصدار كل أداة، يتم وسمها افتراضيًا بأنها «غير آمنة وقابلة للكتابة»، إلا إذا أعلن المطور صراحة أنها آمنة. أداة تحرير الملفات تفرض عليك التحقق مما إذا كنت قد قرأت هذا الملف أولاً؛ وإذا لم تكن قد قرأته، فلن يُسمح لك بتعديله. ليست هذه مجرد «إضافة أدوات» على روبوت محادثة؛ بل هي بيئة تشغيل كاملة، بنواة LLM، مع آليات أمان كاملة.

وهذا يعني شيئًا واحدًا: إن حواجز التنافس لمنتجات الذكاء الاصطناعي قد لا تكون على مستوى النموذج، بل على مستوى الهندسة.

كل مرة يحدث انكسار في الكاش، ترتفع التكلفة 10 أضعاف

يوجد في الكود المُسرّب ملف اسمه promptCacheBreakDetection.ts يتعقب 14 نوعًا من المتجهات المحتملة التي قد تؤدي إلى فشل cache prompts. لماذا سيتعين على مهندسي Anthropic بذل هذا القدر من الجهد لمنع انكسار الكاش؟

انظر إلى التسعير الرسمي لدى Anthropic لتفهم ذلك. على سبيل المثال، في Claude Opus 4.6، يبلغ سعر الإدخال القياسي 5 دولارات لكل مليون token، لكن عند الاستفادة من الكاش فإن سعر القراءة يصبح 0.5 دولار فقط، أي أرخص بنسبة 90%. وبالعكس، في كل مرة يحدث انكسار في الكاش، ترتفع تكلفة الاستدلال 10 أضعاف.

هذا يفسر قرارات بنيوية كثيرة في الكود المُسرّب تبدو «مفرطة التصميم». عند بدء تشغيل Claude Code، يقوم بتحميل الفرع git الحالي، وسجلات commit الأخيرة، وملف CLAUDE.md كـ سياق. يتم تخزين هذه المحتويات الثابتة مؤقتًا عالميًا، مع استخدام وسم الحدود لفصل المحتوى الديناميكي، لضمان عدم معالجة السياق الموجود مرة أخرى في كل محادثة. يوجد أيضًا في الكود آلية تسمى sticky latches تمنع تبديل الأوضاع من تدمير الكاش الذي تم بناؤه مسبقًا. تم تصميم الوكلاء الفرعيين لإعادة استخدام كاش العملية الأصل بدلًا من إعادة إنشاء نافذة سياق خاصة بهم.

وهناك تفاصيل تستحق التوسع فيها. كل من استخدم أدوات البرمجة بالذكاء الاصطناعي يعرف أن المحادثة الأطول تعني ردًا أبطأ؛ لأن كل جولة تحتاج إلى إرسال تاريخ المحادثة السابق إلى النموذج من جديد. النهج المعتاد هو حذف الرسائل القديمة لتحرير المساحة، لكن المشكلة هي أن حذف أي رسالة يكسر استمرارية الكاش، ما يؤدي إلى إعادة معالجة كامل تاريخ المحادثة، فتقفز التأخيرات والتكلفة معًا.

في الكود المُسرّب توجد آلية تسمى cache_edits. بدلًا من حذف الرسائل فعليًا، تقوم بوضع علامة «تخطي» على الرسائل القديمة في طبقة API. النموذج لا يراها، لكن استمرارية الكاش لا يتم كسرها. هذا يعني أنه في محادثة طويلة مستمرة لعدة ساعات، وبعد تنظيف مئات الرسائل القديمة، تكون سرعة الاستجابة في الجولة التالية تقريبًا بنفس سرعة الجولة الأولى. بالنسبة للمستخدمين العاديين، هذه هي الإجابة الأساسية لـ«لماذا يدعم Claude Code محادثات غير محدودة دون أن يصبح بطيئًا».

وفقًا لبيانات المراقبة الداخلية المُسرّبة (تعليقات كود من autoCompact.ts، مع وسم التاريخ 2026-03-10)، وقبل إدخال الحد الأقصى لفشل الضغط التلقائي، كان Claude Code يهدر يوميًا حوالي 250 ألف عملية استدعاء API. ظهرت 1279 جلسة مستخدم (user sessions) مع 50 مرة أو أكثر من فشل الضغط التلقائي المتواصل، وكانت أسوأ جلسة تفشل 3272 مرة على التوالي. وكانت طريقة الإصلاح مجرد إضافة سطر واحد من القيود: MAX_CONSECUTIVE_AUTOCOMPACT_FAILURES = 3.

لذلك، بالنسبة لمنتجات الذكاء الاصطناعي، قد لا تكون تكلفة استدلال النموذج هي الأغلى، بل فشل إدارة الكاش.

44 مفتاحًا، تشير جميعها إلى الاتجاه نفسه

يخفي الكود المُسرّب 44 feature flags—مفاتيح وظائف تم تجميعها بالفعل، لكنها لم تُنشر للعامة. وفقًا لتحليل المجتمع، يتم تصنيف هذه الـflags إلى خمس فئات حسب نطاق الوظيفة، وأكثرها كثافة هي فئة «الوكلاء المستقلين» (12)، وتشير إلى نظام يسمى KAIROS.

يُستشهد بـ KAIROS في كود المصدر أكثر من 150 مرة، وهو نمط «عملية حارسة/خلفية» تعمل دائمًا. لم يعد Claude Code مجرد أداة تستجيب فقط عندما تستدعيها أنت يدويًا، بل أصبح وكيلاً يعمل دائمًا في الخلفية، يراقب باستمرار ويسجل، وينفذ تلقائيًا في الأوقات المناسبة. بشرط ألا يقاطع المستخدم؛ وأي عمليات قد تحجب المستخدم لأكثر من 15 ثانية يتم تأجيل تنفيذها.

يتضمن KAIROS أيضًا إحساسًا بمكان تركيز الطرفية. يوجد في الكود حقل terminalFocus يقوم باكتشاف ما إذا كان المستخدم ينظر إلى نافذة الطرفية في الوقت الفعلي. عندما تقوم بالتبديل إلى المتصفح أو تطبيق آخر، يستنتج الوكيل أنك «لست موجودًا»، فيتحول إلى الوضع المستقل وينفذ المهام بشكل استباقي ويرسل الكود مباشرة دون انتظار تأكيدك. وعندما تعود إلى الطرفية، يعود الوكيل فورًا إلى وضع التعاون: أولاً يبلّغ بما قام به للتو، ثم يطلب رأيك. درجة الاستقلال ليست ثابتة؛ بل تتذبذب ديناميكيًا مع انتباهك. هذا يحل مفارقة ظلت قائمة لدى أدوات الذكاء الاصطناعي لفترة طويلة: فالذكاء الاصطناعي المستقل تمامًا لا يجعل الناس مرتاحين، والذكاء الاصطناعي الخامل تمامًا كفؤته منخفضة جدًا. اختيار KAIROS هو ضبط استباقية الذكاء الاصطناعي وفقًا لانتباه المستخدم؛ عندما تكون ينظر إليه يبقى هادئًا، وعندما تبتعد يعمل من تلقاء نفسه.

تسمى منظومة فرعية أخرى لـ KAIROS autoDream. كلما تراكمت 5 جلسات أو بعد مرور 24 ساعة، يبدأ الوكيل في الخلفية عملية «تأمل» على أربع خطوات. أولاً يقوم بمسح الذاكرة الموجودة لفهم ما يملكه حاليًا. ثم يستخرج المعرفة الجديدة من سجلات المحادثة. بعد ذلك يقوم بدمج المعرفة الجديدة والقديمة، وتصحيح التناقضات وإزالة التكرارات. أخيرًا، يقوم بتبسيط الفهرس وحذف العناصر القديمة. هذا التصميم يستعير نظرية تثبيت الذاكرة من علوم الإدراك. يقوم الإنسان أثناء النوم بتنظيم ذكريات اليوم، ويقوم KAIROS بتنظيم سياق المشروع عندما يغادر المستخدم. بالنسبة للمستخدم العادي، هذا يعني أنك تستخدم Claude Code لفترة أطول، ويفهم مشروعك بدقة أكبر، وليس فقط «يتذكر ما قلته».

الفئة الثانية الأكبر هي «التقطير الكاذب والأمان» (8 flags). ومن أكثر ما يستحق الانتباه هو آلية fake_tools. عندما تتحقق 4 شروط معًا (flag وقت التجميع مفعّل، ومدخل CLI مُفعّل، واستخدام API خاص من الطرف الأول، وأن يكون GrowthBook remote switch true)، يقوم Claude Code بحقن تعريفات أدوات مزيفة داخل طلبات API بهدف تلويث مجموعات البيانات التي قد تُستخدم لتسجيل تدفقات API ولتدريب نماذج منافسة. هذه صيغة دفاع جديدة تمامًا في سباق تسليح الذكاء الاصطناعي؛ ليست منعك من النسخ، بل جعل ما تنسخه غير صحيح.

بالإضافة إلى ذلك، ظهرت في الكود إشارة إلى كود/اسم نموذج Capybara (مقسّم إلى ثلاث طبقات: النسخة القياسية، نسخة fast، ونسخة مليون نافذة سياق). ويخمّن المجتمع على نطاق واسع أنها الاسم الداخلي لسلسلة Claude 5.

بيض عيد الميلاد: في 51.2 ألف سطر من الكود يوجد حيوان أليف إلكتروني

بين كل أطر الهندسة الجادة وآليات الأمان، قام مهندسو Anthropic خفيةً ببناء نظام كامل للحيوانات الأليفة الافتراضية، بالاسم الداخلي BUDDY.

وفقًا للكود المُسرّب وتحليل المجتمع، فإن BUDDY هو حيوان أليف طرفي مُجسّم (على طريقة rendering تحاكي الواقع)، يظهر في شكل مربع فقاعات ASCII بجانب خانة إدخال المستخدم. لديه 18 نوعًا (بما في ذلك كيبّيبارا، وسحلحفاة عفريتية، وفطر، وشبح، وتنين، بالإضافة إلى سلسلة من الكائنات الأصلية مثل Pebblecrab وDustbunny وMossfrog). تُقسّم الأنواع حسب الندرة إلى خمس درجات: عادي (60%)، نادر (25%)، نادر جدًا (10%)، ملحمي (4%)، وأسطوري (1%). ولكل نوع أيضًا «متغير لامع»، وأندر نوع Shiny Legendary Nebulynx تظهر احتماليته واحدة من كل عشرة آلاف فقط.

لكل BUDDY خمس سمات: DEBUGGING (التصحيح)، PATIENCE (الصبر)، CHAOS (الفوضى)، WISDOM (الحكمة) وSNARK (اللسعة اللاذعة). كما يمكنها ارتداء قبعات؛ ومن الخيارات: التاج، وقبعة礼帽 (Bowler Hat)، وقبعة مروحة دوّارة، وهالة، وقبعة ساحر، وحتى وجود بطة صغيرة. يتم تحديد أي حيوان تفقسه من خلال قيمة تجزئة (hash) معرف المستخدم (User ID)، ويقوم Claude بتوليد اسم له وصفاته الشخصية.

وفقًا لخطة الإطلاق المذكورة، كان BUDDY مقررًا بدء الاختبار التجريبي من 1 أبريل إلى 7 أبريل، ثم الإطلاق الرسمي في مايو، ويبدأ ذلك أولاً من الموظفين داخل Anthropic.

في 51.2 ألف سطر من الكود، يوجد 98.4% مكرس لهندسة قوية، لكن في النهاية هناك من قضى وقتًا لصناعة ثؤلول إلكتروني (إشارة إلى حيوان “سلحفاة/ثعبان/سحلية” إلكترونية) سيارت محيط بقبعة مروحة دوّارة. وربما تكون هذه هي أكثر سطر من الكود إنسانية داخل التسريب.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.26Kعدد الحائزين:0
    0.00%
  • القيمة السوقية:$2.26Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.41Kعدد الحائزين:2
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:0
    0.00%
  • تثبيت