العقود الآجلة
وصول إلى مئات العقود الدائمة
CFD
الذهب
منصّة واحدة للأصول التقليدية العالمية
الخیارات المتاحة
Hot
تداول خيارات الفانيلا على الطريقة الأوروبية
الحساب الموحد
زيادة كفاءة رأس المال إلى أقصى حد
التداول التجريبي
مقدمة حول تداول العقود الآجلة
استعد لتداول العقود الآجلة
أحداث مستقبلية
"انضم إلى الفعاليات لكسب المكافآت "
التداول التجريبي
استخدم الأموال الافتراضية لتجربة التداول بدون مخاطر
إطلاق
CandyDrop
اجمع الحلوى لتحصل على توزيعات مجانية.
منصة الإطلاق
-التخزين السريع، واربح رموزًا مميزة جديدة محتملة!
HODLer Airdrop
احتفظ بـ GT واحصل على توزيعات مجانية ضخمة مجانًا
Pre-IPOs
افتح الوصول الكامل إلى الاكتتابات العامة للأسهم العالمية
نقاط Alpha
تداول الأصول على السلسلة واكسب التوزيعات المجانية
نقاط العقود الآجلة
اكسب نقاط العقود الآجلة وطالب بمكافآت التوزيع المجاني
عروض ترويجية
AI
Gate AI
شريكك الذكي الشامل في الذكاء الاصطناعي
Gate AI Bot
استخدم Gate AI مباشرة في تطبيقك الاجتماعي
GateClaw
Gate الأزرق، جاهز للاستخدام
Gate for AI Agent
البنية التحتية للذكاء الاصطناعي، Gate MCP، Skills و CLI
Gate Skills Hub
أكثر من 10 آلاف مهارة
من المكتب إلى التداول، مكتبة المهارات الشاملة تجعل الذكاء الاصطناعي أكثر فعالية
GateRouter
ختر بذكاء من أكثر من 40 نموذج ذكاء اصطناعي، بدون أي رسوم إضافية 0%
كود كلود نصائح لتوفير المال: المهندسون يوفرون 300 مليون توكن في الأسبوع باستخدام التخزين المؤقت، المفتاح هو عدم الانقطاع
هل هناك حد أقصى لاستخدام المحادثة الطويلة مع Claude Code؟ كشف المهندس نيت هيرك، أنه خلال أسبوع واحد، استطاع توفير 3 مليارات توكن باستخدام آلية التخزين المؤقت، مع أعلى استهلاك يومي بلغ 91 مليون توكن. المفتاح ليس في كتابة الكثير من البرامج، بل في كيفية عدم "قطع" التخزين المؤقت، بحيث لا يُهدر التكرار في السياق ويُوفر التكاليف.
(ملخص سابق: مشروع badclaude المفتوح المصدر لتعزيز سرعة Claude code، تلقى إشعار انتهاك حقوق من Anthropic)
(معلومات إضافية: إضافة وظيفة المهام المجدولة عبر السحابة لـ Claude Code! بدون تشغيل الكمبيوتر، الذكاء الاصطناعي يراجع PR، يرقّي النظام)
فهرس المقال
Toggle
عند استخدام العديد من المطورين لـ Claude Code، غالباً ما يكون أكبر مشكلة هو استهلاك التوكنات بسرعة، حيث تصبح المحادثة الطويلة شيئاً من الرفاهية.
لكن، كما كشف نيت هيرك، الذي يشارك تقنيات الذكاء الاصطناعي بشكل متكرر على وسائل التواصل، أن التكاليف الحقيقية لا تكمن في كمية الكود، بل في كيفية استغلال نظام التخزين المؤقت للمحفزات (prompt caching). خلال أسبوع واحد، وفر أكثر من 3 مليارات توكن عبر التخزين المؤقت، مع استهلاك يومي بلغ 91 مليون توكن: حيث أن تكلفة توكنات التخزين المؤقت فقط 10% من تكلفة التوكنات العادية، فبذلك، يُحسب الأمر على أنه استهلاك حوالي 9 ملايين توكن يومياً، مما يطيل عمر المحادثة بشكل شبه مجاني.
لقد وفرت هذا الأسبوع 3 مليارات توكن، مع استهلاك يومي قدره 91 مليون، وأسبوع كامل يتجاوز 3 مليارات.
لم أغير أي إعدادات. فقط كان التخزين المؤقت للمحفزات يعمل بشكل طبيعي في الخلفية.
لكن، بعد فهمي الحقيقي لماهية التخزين المؤقت وكيفية تجنب "قطع"ه، استطعت أن أُطيل مدة المحادثة ضمن نفس الحد المسموح، مما يجعل الجلسات تدوم أطول. لذلك، أعدت إعداد دليل مبسط لـ 80/20 حول أساسيات تخزين مؤقت للمحفزات في Claude Code، بدون الدخول في تفاصيل عميقة حول واجهة برمجة التطبيقات (API).
تكلفة توكنات التخزين المؤقت فقط 10% من تكلفة التوكنات العادية. 9100 ألف توكن مخزنة، تُحسب تقريباً كـ 900 ألف توكن في الفوترة.
مدة TTL للتخزين المؤقت في الاشتراك Claude Code هي ساعة واحدة؛ الافتراضي في API هو 5 دقائق؛ والوكيل الفرعي (Sub-agent) دائماً 5 دقائق.
التخزين المؤقت يتكون من ثلاث طبقات: طبقة النظام، طبقة المشروع، وطبقة المحادثة.
تغيير النموذج أثناء المحادثة يُفسد التخزين المؤقت، بما في ذلك تفعيل وضع "opus plan".
تكلفة التخزين المؤقت فقط 10%، 9100 ألف توكن تساوي 900 ألف
كل توكن مخزن مؤقتاً يكلف 10% من تكلفة التوكن العادي.
لذلك، عندما تظهر لوحة التحكم أن هناك 91 مليون توكن تم استرجاعها من التخزين المؤقت في يوم معين، فإن الفاتورة الفعلية تكون تقريباً مقابل معالجة 9 ملايين توكن فقط. وهذا يفسر لماذا، عند استخدام Claude Code لفترات طويلة، يشعر المستخدم أن المحادثة تكاد تكون "مجانية" من حيث التكاليف.
هناك رقمين في لوحة التحكم يستحقان الانتباه:
Create Cache: تكلفة كتابة المحتوى في التخزين المؤقت، وتبدأ في العمل في الجولة التالية من المحادثة.
Read Cache: التوكنات التي يسترجعها Claude من التخزين المؤقت، مثل ملف CLAUDE.md، تعريف الأدوات، الرسائل السابقة، وغيرها. مقارنة بإعادة معالجتها كمدخلات، فهي أقل تكلفة بعشر مرات.
إذا كانت قيمة Read Cache عالية، فهذا يدل على استخدام فعال للتخزين المؤقت؛ وإذا كانت منخفضة، فهذا يعني أنك تدفع مقابل نفس السياق مراراً وتكراراً.
قال Thariq من Anthropic جملة أثرت فيّ كثيراً: "نراقب معدل استهداف التخزين المؤقت للمحفزات، وإذا كان منخفضاً جداً، نطلق إنذاراً، وربما نعلن عن حالة طوارئ من المستوى SEV."
كتب أيضاً مقالاً جيداً على X. عندما يكون معدل استهداف التخزين المؤقت مرتفعاً، تحدث أربع نتائج:
لكن، إذا كان معدل الاستهداف منخفضاً، فإن الجميع يخسر.
البنية الثلاثية: النظام، المشروع، المحادثة، تتراكم تدريجياً
لذا، فإن الحوافز بين الطرفين متوافقة: Anthropic تريد أن يكون معدل استهداف التخزين المؤقت أعلى، وأنت أيضاً تريد ذلك. وما يبطئ الأمور هو بعض العادات الصغيرة التي تبدو غير مهمة، لكنها تساهم في إعادة بناء التخزين المؤقت بشكل غير ملحوظ.
يعتمد التخزين المؤقت على مطابقة البادئة، أي "مطابقة بداية النص".
بدون الدخول في تفاصيل تقنية عميقة، يكفي أن تفهم: طالما أن المحتوى قبل نقطة معينة يتطابق تماماً مع المحتوى المخزن، يمكن لـ Claude إعادة استخدام التوكنات من التخزين المؤقت.
محادثة جديدة بشكل كامل عادةً تبدأ هكذا:
وفقاً لملف Claude Code، عادةً ما تكون هذه هي طريقة بدء محادثة جديدة:
الجولة الأولى: لا يوجد تخزين مؤقت بعد. يُعالج نظام التوجيه، سياق المشروع (مثل CLAUDE.md، الذاكرة، القواعد)، ورسالتك الأولى، ويتم تخزينها في التخزين المؤقت.
الجولة الثانية: كل المحتوى في الجولة الأولى مخزن مؤقتاً. يكتفي Claude بمعالجة ردك الجديد والرسالة التالية. وتكون التكاليف أقل بكثير.
الجولة الثالثة: نفس المنطق، المحتوى السابق لا يزال مخزناً، فقط آخر تفاعل يُعالج.
أكثر فخاخ "الانقطاع" شيوعاً: تبديل النموذج وفترة الانتظار ساعة واحدة
يمكن تقسيم التخزين المؤقت إلى ثلاث طبقات:
نصائح من مقال Thariq على X:
الطبقة النظامية (System layer): تشمل الأوامر الأساسية، تعريف الأدوات (قراءة، كتابة، bash، grep، glob) وأسلوب الإخراج. هذه الطبقة هي التخزين المؤقت العام.
طبقة المشروع (Project layer): تشمل CLAUDE.md، الذاكرة، قواعد المشروع. وتُخزن بشكل مستقل لكل مشروع.
طبقة المحادثة (Conversation): تشمل الردود والرسائل، وتتزايد مع كل تفاعل.
إذا حدث تغيير في محتوى الطبقتين النظامية أو المشروع أثناء المحادثة، يجب إعادة تخزين كل شيء من البداية. هذه العملية مكلفة جداً، وتخيل أن تتغير التعليمات في الرسالة رقم 16، أو تتوقف ساعة، فكل التوكنات من الرسالة رقم 1 ستُعاد معالجتها من جديد.
هذه أكثر نقطة قد تضلل المستخدمين.
اشتراك Claude Code: TTL الافتراضي ساعة واحدة.
لوحة تحكم المهندس: عرض قراءة وإنشاء التخزين المؤقت
واجهة برمجة التطبيقات لـ Claude: TTL الافتراضي 5 دقائق، ويمكن دفع تكلفة أعلى لرفعها إلى ساعة واحدة.
أي خطة من الخطط: الوكيل الفرعي (Sub-agent): دائماً 5 دقائق.
محادثة على موقع Claude.ai: لا توجد توثيقات رسمية واضحة، ربما مشابهة للاشتراك، لكن لم أتحقق بعد.
قبل عدة أشهر، اشتكى الكثيرون من سرعة استهلاك اشتراك Claude. ظنوا أن Anthropic خفضت TTL من ساعة إلى 5 دقائق بدون إشعار، لكن الحقيقة أن TTL في Claude Code لا يزال ساعة واحدة.
المشكلة أن ملفات Claude Code وAPI منفصلة، وكل منهما يختلف تماماً، مما يسبب بعض الالتباس.
إذا كنت تستخدم تدفقات عمل الوكيل الفرعي بكثرة، أو تستخدم API مباشرة، فإن 5 دقائق مهمة جداً. لكن، بالنسبة لـ 95% من مستخدمي Claude Code، الأهم هو النافذة الزمنية ساعة واحدة.
هذه النقاط أراها مفيدة جداً في الاستخدام اليومي:
قانون الممارسة: استئناف الجلسة يوفر التكاليف أكثر من /compact
لقد أنشأت مهارة لاستئناف الجلسة، بدلاً من /compact، تلخص ما أنجزناه، وما تبقى من قرارات، وأهم الملفات، وأين نتابع. ثم أُدخل الأمر /clear وألصق هذا الملخص، لأواصل دون انقطاع.
أمر /compact أحياناً يكون بطيئاً، بينما هذا الأسلوب عادةً لا يستغرق أكثر من دقيقة.
آلية التخزين المؤقت على Claude.ai غير موثقة بشكل تفصيلي، لكن المشاريع (Projects) واضحة أنها تستخدم تحسينات مختلفة عن المحادثات العادية. لذا، إذا أردت إرفاق ملفات كبيرة، من الأفضل وضعها في المشروع بدلاً من إدراجها مباشرة في المحادثة.
هناك أمور تؤدي إلى إعادة بناء التخزين المؤقت بدون تنبيه:
الصورة التي أظهرتها سابقاً، من لوحة تحكم التوكن، تظهر أن: