كود كلود نصائح لتوفير المال: المهندسون يوفرون 300 مليون توكن في الأسبوع باستخدام التخزين المؤقت، المفتاح هو عدم الانقطاع

هل هناك حد أقصى لاستخدام المحادثة الطويلة مع Claude Code؟ كشف المهندس نيت هيرك، أنه خلال أسبوع واحد، استطاع توفير 3 مليارات توكن باستخدام آلية التخزين المؤقت، مع أعلى استهلاك يومي بلغ 91 مليون توكن. المفتاح ليس في كتابة الكثير من البرامج، بل في كيفية عدم "قطع" التخزين المؤقت، بحيث لا يُهدر التكرار في السياق ويُوفر التكاليف.
(ملخص سابق: مشروع badclaude المفتوح المصدر لتعزيز سرعة Claude code، تلقى إشعار انتهاك حقوق من Anthropic)
(معلومات إضافية: إضافة وظيفة المهام المجدولة عبر السحابة لـ Claude Code! بدون تشغيل الكمبيوتر، الذكاء الاصطناعي يراجع PR، يرقّي النظام)

فهرس المقال

Toggle

  • تكاليف التخزين المؤقت فقط 10%، 91 مليون توكن تساوي 9 مليون
  • بنية ثلاثية الطبقات: النظام، المشروع، المحادثة، تتراكم تدريجياً
  • أكثر فخاخ "الانقطاع" شيوعاً: تبديل النموذج وفترة الانتظار ساعة واحدة
  • لوحة تحكم مصممة ذاتياً من قبل المهندس: عرض قراءة وإنشاء التخزين المؤقت
  • قانون الممارسة: استئناف الجلسة يوفر التكاليف أكثر من /compact

عند استخدام العديد من المطورين لـ Claude Code، غالباً ما يكون أكبر مشكلة هو استهلاك التوكنات بسرعة، حيث تصبح المحادثة الطويلة شيئاً من الرفاهية.

لكن، كما كشف نيت هيرك، الذي يشارك تقنيات الذكاء الاصطناعي بشكل متكرر على وسائل التواصل، أن التكاليف الحقيقية لا تكمن في كمية الكود، بل في كيفية استغلال نظام التخزين المؤقت للمحفزات (prompt caching). خلال أسبوع واحد، وفر أكثر من 3 مليارات توكن عبر التخزين المؤقت، مع استهلاك يومي بلغ 91 مليون توكن: حيث أن تكلفة توكنات التخزين المؤقت فقط 10% من تكلفة التوكنات العادية، فبذلك، يُحسب الأمر على أنه استهلاك حوالي 9 ملايين توكن يومياً، مما يطيل عمر المحادثة بشكل شبه مجاني.


لقد وفرت هذا الأسبوع 3 مليارات توكن، مع استهلاك يومي قدره 91 مليون، وأسبوع كامل يتجاوز 3 مليارات.

لم أغير أي إعدادات. فقط كان التخزين المؤقت للمحفزات يعمل بشكل طبيعي في الخلفية.

لكن، بعد فهمي الحقيقي لماهية التخزين المؤقت وكيفية تجنب "قطع"ه، استطعت أن أُطيل مدة المحادثة ضمن نفس الحد المسموح، مما يجعل الجلسات تدوم أطول. لذلك، أعدت إعداد دليل مبسط لـ 80/20 حول أساسيات تخزين مؤقت للمحفزات في Claude Code، بدون الدخول في تفاصيل عميقة حول واجهة برمجة التطبيقات (API).

تكلفة توكنات التخزين المؤقت فقط 10% من تكلفة التوكنات العادية. 9100 ألف توكن مخزنة، تُحسب تقريباً كـ 900 ألف توكن في الفوترة.

مدة TTL للتخزين المؤقت في الاشتراك Claude Code هي ساعة واحدة؛ الافتراضي في API هو 5 دقائق؛ والوكيل الفرعي (Sub-agent) دائماً 5 دقائق.

التخزين المؤقت يتكون من ثلاث طبقات: طبقة النظام، طبقة المشروع، وطبقة المحادثة.

تغيير النموذج أثناء المحادثة يُفسد التخزين المؤقت، بما في ذلك تفعيل وضع "opus plan".

الوكلاء البرمجيون يحتاجون إلى صناديق زجاجية الآن

jianshuo/ccglass

111 نجمة على GitHub
أنشئ أمس
MIT + جافا سكريبت
وكيل محلي + لوحة تحكم ويب لـ Claude code، codex، deepseek-tui، و kimi
يعرض الأمر الكامل للنظام، مخططات الأدوات، سجل الرسائل، التوكن/التكلفة، و… pic.twitter.com/Wot5SFV16N

— بو جونسون (@BeauJohnson89) 24 مايو 2026

تكلفة التخزين المؤقت فقط 10%، 9100 ألف توكن تساوي 900 ألف

كل توكن مخزن مؤقتاً يكلف 10% من تكلفة التوكن العادي.

لذلك، عندما تظهر لوحة التحكم أن هناك 91 مليون توكن تم استرجاعها من التخزين المؤقت في يوم معين، فإن الفاتورة الفعلية تكون تقريباً مقابل معالجة 9 ملايين توكن فقط. وهذا يفسر لماذا، عند استخدام Claude Code لفترات طويلة، يشعر المستخدم أن المحادثة تكاد تكون "مجانية" من حيث التكاليف.

هناك رقمين في لوحة التحكم يستحقان الانتباه:

Create Cache: تكلفة كتابة المحتوى في التخزين المؤقت، وتبدأ في العمل في الجولة التالية من المحادثة.
Read Cache: التوكنات التي يسترجعها Claude من التخزين المؤقت، مثل ملف CLAUDE.md، تعريف الأدوات، الرسائل السابقة، وغيرها. مقارنة بإعادة معالجتها كمدخلات، فهي أقل تكلفة بعشر مرات.

إذا كانت قيمة Read Cache عالية، فهذا يدل على استخدام فعال للتخزين المؤقت؛ وإذا كانت منخفضة، فهذا يعني أنك تدفع مقابل نفس السياق مراراً وتكراراً.

قال Thariq من Anthropic جملة أثرت فيّ كثيراً: "نراقب معدل استهداف التخزين المؤقت للمحفزات، وإذا كان منخفضاً جداً، نطلق إنذاراً، وربما نعلن عن حالة طوارئ من المستوى SEV."

كتب أيضاً مقالاً جيداً على X. عندما يكون معدل استهداف التخزين المؤقت مرتفعاً، تحدث أربع نتائج:

  • يشعر Claude Code بسرعة أكبر
  • تنخفض تكاليف خدمة Anthropic
  • تزداد مدة استهلاك الاشتراك الخاص بك
  • يصبح التشفير الطويل أكثر واقعية

لكن، إذا كان معدل الاستهداف منخفضاً، فإن الجميع يخسر.

البنية الثلاثية: النظام، المشروع، المحادثة، تتراكم تدريجياً

لذا، فإن الحوافز بين الطرفين متوافقة: Anthropic تريد أن يكون معدل استهداف التخزين المؤقت أعلى، وأنت أيضاً تريد ذلك. وما يبطئ الأمور هو بعض العادات الصغيرة التي تبدو غير مهمة، لكنها تساهم في إعادة بناء التخزين المؤقت بشكل غير ملحوظ.

يعتمد التخزين المؤقت على مطابقة البادئة، أي "مطابقة بداية النص".

بدون الدخول في تفاصيل تقنية عميقة، يكفي أن تفهم: طالما أن المحتوى قبل نقطة معينة يتطابق تماماً مع المحتوى المخزن، يمكن لـ Claude إعادة استخدام التوكنات من التخزين المؤقت.

محادثة جديدة بشكل كامل عادةً تبدأ هكذا:

وفقاً لملف Claude Code، عادةً ما تكون هذه هي طريقة بدء محادثة جديدة:

الجولة الأولى: لا يوجد تخزين مؤقت بعد. يُعالج نظام التوجيه، سياق المشروع (مثل CLAUDE.md، الذاكرة، القواعد)، ورسالتك الأولى، ويتم تخزينها في التخزين المؤقت.
الجولة الثانية: كل المحتوى في الجولة الأولى مخزن مؤقتاً. يكتفي Claude بمعالجة ردك الجديد والرسالة التالية. وتكون التكاليف أقل بكثير.
الجولة الثالثة: نفس المنطق، المحتوى السابق لا يزال مخزناً، فقط آخر تفاعل يُعالج.

أكثر فخاخ "الانقطاع" شيوعاً: تبديل النموذج وفترة الانتظار ساعة واحدة

يمكن تقسيم التخزين المؤقت إلى ثلاث طبقات:

نصائح من مقال Thariq على X:

الطبقة النظامية (System layer): تشمل الأوامر الأساسية، تعريف الأدوات (قراءة، كتابة، bash، grep، glob) وأسلوب الإخراج. هذه الطبقة هي التخزين المؤقت العام.
طبقة المشروع (Project layer): تشمل CLAUDE.md، الذاكرة، قواعد المشروع. وتُخزن بشكل مستقل لكل مشروع.
طبقة المحادثة (Conversation): تشمل الردود والرسائل، وتتزايد مع كل تفاعل.

إذا حدث تغيير في محتوى الطبقتين النظامية أو المشروع أثناء المحادثة، يجب إعادة تخزين كل شيء من البداية. هذه العملية مكلفة جداً، وتخيل أن تتغير التعليمات في الرسالة رقم 16، أو تتوقف ساعة، فكل التوكنات من الرسالة رقم 1 ستُعاد معالجتها من جديد.

هذه أكثر نقطة قد تضلل المستخدمين.

اشتراك Claude Code: TTL الافتراضي ساعة واحدة.

لوحة تحكم المهندس: عرض قراءة وإنشاء التخزين المؤقت

واجهة برمجة التطبيقات لـ Claude: TTL الافتراضي 5 دقائق، ويمكن دفع تكلفة أعلى لرفعها إلى ساعة واحدة.
أي خطة من الخطط: الوكيل الفرعي (Sub-agent): دائماً 5 دقائق.

محادثة على موقع Claude.ai: لا توجد توثيقات رسمية واضحة، ربما مشابهة للاشتراك، لكن لم أتحقق بعد.

قبل عدة أشهر، اشتكى الكثيرون من سرعة استهلاك اشتراك Claude. ظنوا أن Anthropic خفضت TTL من ساعة إلى 5 دقائق بدون إشعار، لكن الحقيقة أن TTL في Claude Code لا يزال ساعة واحدة.

المشكلة أن ملفات Claude Code وAPI منفصلة، وكل منهما يختلف تماماً، مما يسبب بعض الالتباس.

إذا كنت تستخدم تدفقات عمل الوكيل الفرعي بكثرة، أو تستخدم API مباشرة، فإن 5 دقائق مهمة جداً. لكن، بالنسبة لـ 95% من مستخدمي Claude Code، الأهم هو النافذة الزمنية ساعة واحدة.

هذه النقاط أراها مفيدة جداً في الاستخدام اليومي:

  • إذا مر أكثر من ساعة، فإن المحتوى السابق يكون قد انتهت صلاحيته من التخزين المؤقت.
  • رسالتك التالية ستُعيد بناء التخزين المؤقت من جديد.
  • في هذه الحالة، من الأفضل أن تقوم بعملية انتقال واضحة، وتبدأ جلسة جديدة، حيث يكون التكاليف أقل غالباً.
  • أمر /compact أو /clear يُفسد التخزين المؤقت، لذا من الأفضل أن تستخدمها عند الحاجة لإعادة البناء.

قانون الممارسة: استئناف الجلسة يوفر التكاليف أكثر من /compact

لقد أنشأت مهارة لاستئناف الجلسة، بدلاً من /compact، تلخص ما أنجزناه، وما تبقى من قرارات، وأهم الملفات، وأين نتابع. ثم أُدخل الأمر /clear وألصق هذا الملخص، لأواصل دون انقطاع.

أمر /compact أحياناً يكون بطيئاً، بينما هذا الأسلوب عادةً لا يستغرق أكثر من دقيقة.

آلية التخزين المؤقت على Claude.ai غير موثقة بشكل تفصيلي، لكن المشاريع (Projects) واضحة أنها تستخدم تحسينات مختلفة عن المحادثات العادية. لذا، إذا أردت إرفاق ملفات كبيرة، من الأفضل وضعها في المشروع بدلاً من إدراجها مباشرة في المحادثة.

هناك أمور تؤدي إلى إعادة بناء التخزين المؤقت بدون تنبيه:

  • تبديل النموذج: لأن التخزين يعتمد على مطابقة البادئة، وكل نموذج له تخزينه الخاص. عند التبديل، لن يكون هناك أي تطابق، وسيتم إعادة قراءة التاريخ بالكامل.
  • وضع "Opus plan": يُستخدم خلال التخطيط، ويُطبق خلال التنفيذ، ويعتمد على خطة Opus أو Sonnet. كما ذكرت سابقاً، كل تغيير في الخطة هو في جوهره تغيير في النموذج، مما يعيد بناء التخزين المؤقت. على المدى الطويل، يساعد على تمديد مدة الجلسة، لكن من المهم فهم ما يحدث في الأسفل.
  • تحرير ملف CLAUDE.md أثناء المحادثة: يمكن ذلك، لكن التعديلات لن تُطبق إلا عند إعادة التشغيل، ولن تؤثر على التخزين المؤقت الجاري.

الصورة التي أظهرتها سابقاً، من لوحة تحكم التوكن، تظهر أن:

https://github.com/nateherkai/token-dashboard
هذا مستودع GitHub بسيط. تعطي الرابط لـ Claude Code، ليقوم بالنشر محلياً على localhost، ويقرأ جميع سجلات المحادثة السابقة، بدلاً من البدء من الصفر. ستتمكن من رؤية بيانات الإدخال والإخراج، وإنشاء التخزين المؤقت، وقراءة البيانات، وغيرها.

لكن، يجب الانتباه: هذه اللوحة تتعلق بالتوكنات على الجهاز المحلي. إذا انتقلت من جهاز مكتبي إلى لابتوب، الأرقام لن تتطابق تماماً، فكل جهاز لديه إحصائياته الخاصة.

التخزين المؤقت للمحفزات موضوع يمكن دراسته بعمق. مقال Thariq يغطيه بشكل أوسع، وإذا رغبت في الصورة الكاملة، أنصح بقراءته.

لكن، لست بحاجة لفهم كل التفاصيل للاستفادة. يكفي أن تتقن أهم 80/20: توكنات التخزين المؤقت أقل تكلفة بعشر مرات، TTL في Claude Code هو ساعة واحدة، تبديل النموذج يُفسد التخزين، والانتقال الواضح بين المهام أفضل من انتظار انتهاء صلاحية جلسة قديمة.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت