ماذا يفعل وكيل الذكاء الاصطناعي حقًا؟ تحليل كامل لتسريب 500,000 سطر من رمز كلود كود

51.2万行 من الكود، و1906 ملفات، و59.8 ميغابايت من source map. في فجر 31 مارس، اكتشف Chaofan Shou من Solayer Labs أن المنتج الرئيسي لدى Anthropic Claude Code كشف عن الكود المصدري كاملًا في مستودع npm عام. خلال ساعات، تم عمل mirror للكود على GitHub، وتجاوزت عدد عمليات الـ fork 4.1万.

هذه ليست المرة الأولى التي يقع فيها Anthropic في هذا الخطأ. عندما تم إصدار Claude Code لأول مرة في فبراير 2025، حدثت مرة سابقة أيضًا عملية تسريب لنفس source map. رقم الإصدار في هذه المرة هو v2.1.88، وكانت الأسباب نفسها: أداة البناء Bun تولّد source map افتراضيًا، بينما تم نسيان هذا الملف داخل .npmignore.

معظم التقارير تلخص مفاجآت مخفية في التسريب، مثل نظام حيوانات أليفة افتراضية، وخيار «وضع التمويه» الذي يجعل Claude مجهول الهوية يقدّم كودًا لمشاريع مفتوحة المصدر. لكن السؤال الحقيقي الذي يستحق التفكيك هو: لماذا يظهر نفس نموذج Claude اختلافًا كبيرًا بين النسخة الخاصة بواجهة الويب وClaude Code؟ ماذا تفعل فعليًا 51.2万行 من الكود؟

النموذج ليس سوى طرف الجبل الجليدي

الجواب مخبأ في بنية الكود. وفقًا لتحليل عكسي للكود المسرب من مجتمع GitHub، فإن من أصل 51.2万行 من TypeScript، فإن كود الواجهات المسؤول مباشرة عن استدعاء نموذج AI لا يتجاوز حوالي 8000 سطر، أي 1.6% من الإجمالي.

فيمَ تتجه بقية 98.4%؟ أكبر وحدتين هما محرك الاستعلامات (4.6万 سطر) ونظام الأدوات (2.9万 سطر). يعالج محرك الاستعلامات استدعاءات LLM API، والإخراج المتدفق، وتنسيق التخزين المؤقت، وإدارة محادثات متعددة الجولات. بينما يعرّف نظام الأدوات نحو 40 أداة مدمجة و50 أوامر بشرط الشرطة المائلة (slash commands)، لتكوين بنية شبيهة بالملحقات؛ ولكل أداة تحكم مستقل في الصلاحيات.

بالإضافة إلى ذلك، توجد 2.5万 سطر في كود عرض واجهة المستخدم الطرفية (ومنها ملف باسم print.ts يبلغ طوله 5594 سطرًا، ويمتد عبر دالة واحدة 3167 سطرًا)، و2万 سطر في التحكم بالأمان والصلاحيات (يتضمن 23 فحص أمان Bash مُرقّمًا و18 أمرًا مبنيًا في Zsh تم حجبها)، و1.8万 سطر في نظام تنسيق الوكلاء المتعددين.

بعد تحليل الكود المسرب، أشار الباحث في أبحاث تعلم الآلة Sebastian Raschka إلى أن السبب وراء كون Claude Code أقوى من نسخة الويب لنفس النموذج لا يكمن في النموذج نفسه، بل في «الهيكل البرمجي» المبني حول النموذج؛ بما في ذلك تحميل سياق المستودع، وتوزيع الأدوات المخصصة، واستراتيجيات التخزين المؤقت، وتعاون الوكلاء الفرعيين. وذهب إلى أبعد من ذلك، معتبرًا أنه إذا وضعت نفس هيكل الهندسة على نماذج أخرى مثل DeepSeek أو Kimi، يمكن أيضًا تحقيق تحسن قريب في أداء البرمجة.

قد يساعدك مقارنة مباشرة على فهم حجم الفارق. عندما تكتب سؤالًا في ChatGPT أو Claude على الويب، يعالج النموذج السؤال ثم يعيد الإجابة وتنتهي المحادثة دون ترك أي شيء. لكن طريقة Claude Code مختلفة تمامًا: عند بدء التشغيل يقرأ ملفات مشروعك أولًا، ويفهم بنية قاعدة كودك، ويتذكر تفضيلك الذي ذكرتَه من قبل مثل «لا تقم بعمل mock لقاعدة البيانات في الاختبارات». يمكنه تنفيذ الأوامر مباشرة داخل طرفيتك، وتحرير الملفات، وتشغيل الاختبارات. وعند مواجهة مهام معقدة يقوم بتقسيمها إلى مهام فرعية متعددة وتوزيعها على وكلاء فرعيين مختلفين لمعالجتها بالتوازي. وبعبارة أخرى: الذكاء الاصطناعي في واجهة الويب هو نافذة أسئلة وأجوبة، بينما Claude Code هو متعاون «يعيش» داخل جهازك.

قام أحدهم بمقارنة هذه البنية بنظام تشغيل: 42 أداة مدمجة تعادل نداءات النظام (system calls)، ونظام الصلاحيات يعادل إدارة المستخدمين، وبروتوكول MCP يعادل برامج تشغيل الأجهزة (device drivers)، وتنسيق الوكلاء الفرعيين يعادل جدولة العمليات (process scheduling). عند شحن كل أداة، تكون موسومة افتراضيًا على أنها «غير آمنة وقابلة للكتابة»، ما لم يصرّح المطور عمدًا أنها آمنة. أداة تحرير الملفات تفرض عليك فحص ما إذا كنت قد قرأت هذا الملف مسبقًا؛ فإذا لم تقرأه فلا يسمح لك بتعديله. هذه ليست مجرد روبوت محادثة أُضيفت إليه عدة أدوات، بل بيئة تشغيل كاملة بنواة LLM مع آليات أمان متكاملة.

وهذا يعني شيئًا واحدًا: قد لا تكمن الحاجزات التنافسية في طبقة النموذج، بل في طبقة الهندسة.

في كل مرة يحدث «اختراق للتخزين المؤقت» ترتفع التكلفة 10 أضعاف

ضمن الكود المسرب توجد ملف باسم promptCacheBreakDetection.ts، وهو يتتبع 14 نوعًا من العوامل المحتملة التي قد تجعل prompt cache يفشل (يفقد صلاحيته). لماذا استثمر مهندسو Anthropic كل هذا الجهد لمنع اختراق التخزين المؤقت؟

انظر إلى تسعير Anthropic الرسمي لتفهم. خذ Claude Opus 4.6 كمثال: سعر إدخال قياسي هو 5 دولارات لكل مليون token، لكن إذا تم الوصول إلى cache فالسعر عند القراءة يصبح 0.5 دولار فقط، أي أرخص بنسبة 90%. وبالمقابل، في كل مرة يحدث فيها اختراق للتخزين المؤقت، ترتفع تكلفة الاستدلال 10 أضعاف.

هذا يفسر العديد من قرارات معمارية تبدو وكأنها «تصميم مفرط» داخل الكود المسرب. عند تشغيل Claude Code يقوم بتحميل الفرع git الحالي، وسجلات commit الأخيرة، والملف CLAUDE.md كوسياق؛ ويتم تخزين المحتويات الثابتة عالميًا مؤقتًا (cached)، مع استخدام علامات حدود لفصل المحتوى الديناميكي، لضمان ألا تتم معالجة السياق الموجود مسبقًا مرة أخرى في كل محادثة. كما يوجد في الكود آلية تسمى sticky latches تمنع تبديل الأنماط من تخريب التخزين المؤقت الذي تم بناؤه. تم تصميم الوكلاء الفرعيين لإعادة استخدام تخزين الوالد المؤسسي، بدل إعادة إنشاء نافذة سياق خاصة بهم من الصفر.

يوجد تفصيل يستحق التوسع فيه. جميع من استخدموا أدوات برمجة تعتمد على الذكاء الاصطناعي يعرفون أنه كلما طال الحوار، تباطأ رد AI أكثر، لأن كل جولة تتطلب إرسال السجل السابق بالكامل إلى النموذج. النهج المعتاد هو حذف الرسائل القديمة لتوفير مساحة، لكن المشكلة هي أن حذف أي رسالة يكسر التتابع الذي يعتمد عليه التخزين المؤقت، مما يؤدي إلى إعادة معالجة كامل تاريخ المحادثة؛ فتقفز الكلفة والكمون معًا.

في الكود المسرب توجد آلية اسمها cache_edits: بدلًا من حذف الرسائل فعليًا، يتم وسم الرسائل القديمة في طبقة API بعلامة «تخطي» (skip). لا يستطيع النموذج رؤية هذه الرسائل، لكن الاستمرارية في التخزين المؤقت لا تنكسر. هذا يعني أنه خلال محادثة طويلة مستمرة لساعات، بعد تنظيف مئات الرسائل القديمة، تصبح سرعة الاستجابة في الجولة التالية قريبة جدًا من سرعة الجولة الأولى. وبالنسبة للمستخدم العادي، هذه هي الإجابة الأساسية لـ «لماذا يمكن لـ Claude Code دعم محادثات طويلة بلا نهاية دون أن يتباطأ».

وفق بيانات مراقبة داخلية مسربة (مأخوذة من تعليقات كود في autoCompact.ts، ومؤرخة في 10 مارس 2026)، قبل إدخال حد فشل التخزين المؤقت التلقائي، كان Claude Code يهدر يوميًا نحو 250 ألف عملية استدعاء API. وظهر أن 1279 مستخدمًا ضمن جلسات (user sessions) واجهوا أكثر من 50 مرة متتالية من فشل الضغط التلقائي (auto compact). وكانت الأسوأ: جلسة واحدة فشلت 3272 مرة على التوالي. طريقة الإصلاح كانت إضافة سطر واحد فقط: MAX_CONSECUTIVE_AUTOCOMPACT_FAILURES = 3.

لذا، بالنسبة لمنتجات الذكاء الاصطناعي، قد لا تكون تكلفة استدلال النموذج هي أغلى طبقة، بل قد تكون تكلفة فشل إدارة التخزين المؤقت.

44 مفتاحًا، تتجه نحو الاتجاه نفسه

داخل الكود المسرب توجد 44 feature flags—مفاتيح وظائف جاهزة ومجمعة، لكنها لم تُنشر للعامة بعد. وفق تحليل المجتمع، يتم تصنيف هذه الـ flags حسب المجالات الوظيفية إلى خمس فئات. وأشدها كثافة هي فئة «الوكلاء المستقلين» (12)، وتتجه نحو نظام باسم KAIROS.

يُشار إلى KAIROS في كود المصدر أكثر من 150 مرة، وهو نمط «عملية حارسة» (background daemon) تعمل باستمرار. لم يعد Claude Code مجرد أداة تستجيب عندما تستدعيها بنفسك فقط، بل وكيل يعمل دائمًا في الخلفية، يراقب باستمرار ويسجل، ويتصرف بشكل استباقي عندما يحين الوقت المناسب. الشرط هو ألا يقطع على المستخدم؛ وأي عمليات قد تسد المستخدم لأكثر من 15 ثانية سيتم تأجيل تنفيذها.

يتضمن KAIROS أيضًا إدراك التركيز (terminal focus). يوجد في الكود حقل باسم terminalFocus يقوم باكتشاف ما إذا كان المستخدم ينظر إلى نافذة الطرفية في الوقت الفعلي. عندما تقوم بالتبديل إلى المتصفح أو تطبيق آخر، يقرر الوكيل أنك «لست في مكان الطرفية»، فيتحول إلى وضع مستقل ويبدأ تنفيذ المهام وتنفيذ تقديم الكود مباشرة بدون انتظار تأكيدك. وعندما تعود إلى الطرفية، يعود الوكيل فورًا إلى وضع التعاون: أولًا يبلّغ ماذا فعل للتو، ثم يطلب رأيك. درجة الاستقلال ليست ثابتة، بل تتذبذب ديناميكيًا مع انتباهك. هذا يحل مشكلة محرجة ظلت أدوات AI لفترة طويلة: الاستقلال الكامل للذكاء الاصطناعي يجعلك غير مرتاح، بينما الخمول الكامل للذكاء الاصطناعي تكون كفاءته منخفضة جدًا. اختيار KAIROS هو أن تتغير استباقية الذكاء الاصطناعي ديناميكيًا تبعًا لانتباه المستخدم؛ طالما أنك تراقبه فهو «يجلس»، وعندما تبتعد عنه يعمل بنفسه.

يحتوي KAIROS على نظام فرعي آخر اسمه autoDream. بعد تجميع 5 جلسات أو مرور 24 ساعة، يقوم الوكيل في الخلفية بتشغيل عملية «تأمل» (reflection) مقسمة إلى أربع خطوات. أولًا، يقوم بمسح الذاكرة الموجودة لمعرفة ما الذي يملكه حاليًا. ثم يستخرج المعرفة الجديدة من سجلات المحادثة. بعد ذلك يقوم بدمج المعرفة الجديدة والقديمة، ويصحح التناقضات ويزيل التكرارات. وأخيرًا يقوم بتبسيط الفهرس وحذف الإدخالات القديمة. هذا التصميم يستفيد من نظرية تدعيم الذاكرة في علوم الإدراك (cognitive science). أثناء النوم يقوم الإنسان بترتيب ذكريات اليوم، بينما يقوم KAIROS بترتيب سياق المشروع عندما يغادر المستخدم. وبالنسبة للمستخدم العادي، فهذا يعني أنه كلما استخدمت Claude Code مدة أطول، أصبحت دقته في فهم مشروعك أعلى—وليس مجرد «تذكر ما قلته».

الفئة الثانية هي «فك التقطير العكسي والأمان» (8 flags). ومن أكثر ما يستحق الانتباه هو آلية fake_tools: عندما تتحقق 4 شروط في نفس الوقت (flag وقت الترجمة مفعّل، ومدخل CLI مفعّل، واستخدام واجهة API تابعة لشركة Anthropic نفسها، وأن يكون GrowthBook remote switch على true)، يقوم Claude Code بحقن تعريفات أدوات مزيفة داخل طلبات API بهدف تلوث مجموعات البيانات التي قد تُستخدم عند تسجيل تدفقات API ومن أجل تدريب نماذج منافسة. هذه شكل دفاعي جديد تمامًا في سباق تسليح الذكاء الاصطناعي: ليس لمنعك من النسخ، بل لتمكينك من النسخ لكن إلى أشياء خاطئة.

بالإضافة إلى ذلك، يظهر في الكود ترميز نموذج Capybara (بثلاثة مستويات: النسخة القياسية، ونسخة fast، ونسخة نافذة سياق بملايين). ويخمنه المجتمع على نطاق واسع باعتباره الترميز الداخلي لسلسلة Claude 5.

بيض/مفاجأة: داخل 51.2万行 من الكود تكمن «حيوانة إلكترونية أليفة»

بين كل بنى هندسية جادة وآليات أمان، قام مهندسو Anthropic أيضًا سرًا ببناء نظام كامل لحيوانات أليفة افتراضية، برمز داخلي BUDDY.

وفقًا لما ورد في الكود المسرب وتحليلات المجتمع، فإن BUDDY هو حيوان أليف طرفي مُجسَّم (拟物化)، يظهر في شكل فقاعات ASCII بجانب مربع إدخال المستخدم. لديه 18 نوعًا (بما في ذلك قندس الماء، وسحلية البرمائيات، وفطر، وشبح، وتنّين، بالإضافة إلى سلسلة من الكائنات الأصلية مثل Pebblecrab وDustbunny وMossfrog)، ويتم تقسيمها إلى خمسة مستويات حسب الندرة: عادي (60%)، ونادر (25%)، وrare (10%)، وepic (4%)، وlegendary (1%). ولكل نوع أيضًا «صيغة لامعة» (Shining variant)؛ وأندرها Shiny Legendary Nebulynx تظهر احتمالية وجودها بنسبة واحد من كل عشرة آلاف.

لكل BUDDY خمس سمات: DEBUGGING (التدقيق)، وPATIENCE (الصبر)، وCHAOS (الفوضى)، وWISDOM (الحكمة)، وSNARK (التهكم/اللسعة). كما يمكنه ارتداء قبعات؛ تشمل الخيارات تاجًا، وقبعة礼帽، وقبعة مروحة لولبية، وهالة، وقبعة ساحر، وحتى بطة صغيرة مصغرة. يتم تحديد أي حيوان أليف سيتم فقسه بناءً على قيمة تجزئة (hash) معرف المستخدم (user ID)، وسيقوم Claude بإنشاء اسم له وشخصية.

بحسب خطة الإطلاق المسربة، كان من المقرر بدء الاختبار التجريبي (内测) لـ BUDDY من 4 أبريل إلى 7 أبريل، ثم الإطلاق الرسمي في مايو، بدءًا من موظفي Anthropic داخل الشركة.

51.2万行 من الكود، و98.4% منها لأعمال هندسية صلبة، لكن في النهاية شخص ما خصص وقتًا ليصنع ثعبانًا/سحلية إلكترونية ستعمل وهي ترتدي قبعة مروحة لولبية. ربما تكون هذه هي أكثر سطر كود «إنسانيًا» في التسريب.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.26Kعدد الحائزين:0
    0.00%
  • القيمة السوقية:$2.26Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.41Kعدد الحائزين:2
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:0
    0.00%
  • تثبيت