دليل تخزين رمز Claude لمهندسي أنثروبيك لتوفير 300 مليون توكن أسبوعيًا

العنوان الأصلي: كيف يقوم مهندسو أنثروبيك فعليًا بحفظ الرموز
الكاتب الأصلي: نيت هيرك
الترجمة: بيغي، بلوك بيتس

ملاحظة المحرر: كثير من الناس عند استخدام Claude Code، يشعرون أن استهلاك الرموز سريع جدًا، وأن المحادثات الطويلة تستهلك الحصة بسهولة. لكن من وجهة نظر مهندسي أنثروبيك، التأثير الحقيقي على التكاليف غالبًا لا يكون في كمية الكود الذي تكتبه، بل في مدى إعادة استخدام السياق المعالج مسبقًا بشكل مستمر.

المحور الرئيسي لهذا المقال هو كيفية توفير الرموز من خلال آلية التخزين المؤقت. خلال أسبوع، أعاد المستخدمون استخدام أكثر من 300 مليون رمز عبر التخزين المؤقت، ووصل حجم التخزين المؤقت في يوم واحد إلى 91 مليون. وبما أن تكلفة الرموز المخزنة مؤقتًا تساوي فقط 10% من تكلفة الرموز المدخلة العادية، فإن 91 مليون رمز مخزن مؤقتًا يعادل تقريبًا 9 ملايين رمز عادي من حيث التكاليف. إن سبب بقاء جلسات Claude Code طويلة و«متحملة» أكثر، ليس لأن النموذج يعمل مجانًا، بل لأن الكثير من السياقات المكررة تم إعادة استخدامها بنجاح.

المفتاح في التخزين المؤقت للمحفزات هو «عدم كسر التخزين المؤقت». يقوم Claude Code بتخزين طبقات من الإشعارات النظامية، وتعريف الأدوات، وملف CLAUDE.md، وقواعد المشروع، والحوار التاريخي؛ طالما أن بادئة الطلبات اللاحقة تتطابق، يمكن لـ Claude قراءة التخزين المؤقت مباشرة دون الحاجة لإعادة معالجة السياق بالكامل. كما يراقب فريق أنثروبيك معدل إعادة استخدام التخزين المؤقت للمحفزات، لأنه يؤثر ليس فقط على حصة المستخدم، بل أيضًا على تكلفة خدمة النموذج وكفاءته التشغيلية.

بالنسبة للمستخدم العادي، لا حاجة لفهم كل التفاصيل التقنية، فقط يجب تبني بعض العادات الأساسية: عدم ترك المحادثة فارغة لأكثر من ساعة؛ إجراء تسليم الجلسة عند تغيير المهمة؛ تجنب التبديل المتكرر بين النماذج؛ وضع المستندات الكبيرة في المشاريع بدلاً من لصقها مرارًا وتكرارًا في الحوار.

هذه المقالة، بدلاً من أن تكون مجرد تقنية لتوفير الرموز، تقدم طريقة أكثر اقترابًا من التفكير الهندسي لاستخدام Claude Code: اعتبار السياق كأصل إدارة، واستمرار إعادة استخدام التخزين المؤقت، وتقليل الحسابات المكررة في المحادثات الطويلة.

وفيما يلي النص الأصلي:

لقد وفرت هذا الأسبوع 300 مليون رمز، و91 مليون في يوم واحد، وأكثر من 300 مليون خلال أسبوع.

لم أغير أي إعدادات. هذا ببساطة هو عمل التخزين المؤقت للمحفزات في الخلفية بشكل طبيعي.

لكن عندما فهمت حقًا ما هو التخزين المؤقت وكيفية تجنب كسره، استطعت أن أستمر في المحادثة لفترة أطول بنفس حصة الاستخدام. لذلك، أقدم هنا دليلًا مبسطًا لمدخلات Claude Code للتخزين المؤقت للمحفزات بنسبة 80/20، بدون الدخول في تفاصيل عميقة على مستوى API.

ملخص سريع

تكلفة الرموز المخزنة مؤقتًا تساوي فقط 10% من تكلفة الرموز المدخلة العادية. 91 مليون رمز مخزن مؤقتًا، يُحسب تكلفتها فعليًا تقريبًا كـ 9 ملايين رمز.

مدة صلاحية التخزين المؤقت في اشتراك Claude Code هي ساعة واحدة؛ في API الافتراضي هي 5 دقائق؛ وفي الوكيل الفرعي دائمًا 5 دقائق.

التخزين المؤقت ينقسم إلى ثلاثة مستويات: مستوى النظام، مستوى المشروع، مستوى الحوار.

تغيير النموذج أثناء المحادثة قد يكسر التخزين المؤقت، بما في ذلك تفعيل وضع «opus plan».

كيف يُحسب المال على التخزين المؤقت؟

كل رمز مخزن مؤقتًا، تكلفته تساوي 10% من تكلفة الرموز المدخلة العادية.

لذا، عندما يظهر في لوحة التحكم أن 91 مليون رمز تم استدعاؤها من التخزين المؤقت في يوم معين، فإن التكاليف الفعلية تقريبًا تعادل معالجة 9 ملايين رمز. وهذا هو السبب في أن استخدام Claude Code لفترات طويلة، مع وجود تخزين مؤقت، يجعل المحادثة تبدو «مجانية» تقريبًا من حيث التمديد.

هناك رقمين في لوحة التحكم يستحقان التركيز:

Cache create: تكلفة كتابة المحتوى في التخزين المؤقت، وهي تكلفة لمرة واحدة. وتبدأ في العمل في الجولة التالية من الحوار.
Cache read: الرموز التي يستعيدها Claude من التخزين المؤقت، مثل ملف CLAUDE.md، وتعريف الأدوات، والرسائل السابقة. مقارنة بإعادة معالجتها كمدخل، فإنها أرخص بعشرة أضعاف.

إذا كانت قيمة Cache read عالية، فهذا يدل على أنك تستفيد بشكل فعال من التخزين المؤقت؛ وإذا كانت منخفضة، فهذا يعني أنك تدفع مقابل نفس السياق مرارًا وتكرارًا.

قال ثاريق من أنثروبيك جملة أثرت فيّ كثيرًا: «نحن نراقب معدل استدعاء التخزين المؤقت، وإذا انخفض بشكل كبير، فإننا نطلق إنذارًا، وربما نعلن عن حالة طوارئ من المستوى SEV.»

كتب أيضًا مقالًا ممتازًا على X. عندما يكون معدل استدعاء التخزين المؤقت مرتفعًا، تحدث أربع نتائج في آن واحد: يشعر Claude Code بسرعة أكبر، تنخفض تكاليف خدمة أنثروبيك، وتصبح حصة الاشتراك أكثر تحملًا، وتصبح المحادثات الطويلة أكثر واقعية.

لكن إذا كان معدل الاستدعاء منخفضًا، فإن الجميع يخسر.

لذا، فإن الحوافز بين الطرفين متوافقة: أنثروبيك تريد معدل استدعاء أعلى، وأنت أيضًا تريد ذلك. العوائق الحقيقية ليست إلا عادات صغيرة تبدو غير مهمة، لكنها قد تعيد ضبط التخزين المؤقت بشكل غير ملحوظ.

كيف ينمو التخزين المؤقت في كل جولة من الحوار؟

يعتمد التخزين المؤقت على مطابقة البادئة، أي «مطابقة المقدمة».

لا حاجة للخوض في التفاصيل التقنية العميقة، فقط عليك فهم نقطة واحدة: طالما أن المحتوى قبل نقطة معينة يتطابق تمامًا مع المحتوى المخزن، يمكن لـ Claude إعادة استخدام الرموز المخزنة مؤقتًا.

محادثة جديدة كليًا عادةً تتبع هذا النمط:

وفقًا لوثائق Claude Code، عادةً يتم تشغيل محادثة جديدة على النحو التالي:

الجولة الأولى من الحوار: لا يوجد أي تخزين مؤقت. يتم معالجة الإشعارات النظامية، وسياق المشروع (مثل CLAUDE.md، والذاكرة، والقواعد)، والرسالة الأولى، وإعادة كتابتها وتخزينها.

الجولة الثانية: كل المحتوى من الجولة الأولى مخزن الآن. يحتاج Claude فقط لمعالجة ردك الجديد والرسالة التالية. ستكون التكاليف أقل بكثير في هذه المرحلة.

الجولة الثالثة: نفس المنطق. الحوار السابق لا يزال مخزنًا، ويحتاج فقط إلى معالجة أحدث تفاعل.

يمكن تقسيم التخزين المؤقت إلى ثلاثة مستويات:

نص من مقال ثاريق على X:

المستوى النظامي (System layer): يشمل الأوامر الأساسية، وتعريف الأدوات (read، write، bash، grep، glob)، وأسلوب الإخراج. هذا هو التخزين المؤقت العام.

المستوى المشروع (Project layer): يشمل CLAUDE.md، والذاكرة، وقواعد المشروع. يُخزن على مستوى المشروع.

مستوى الحوار (Conversation): يشمل الردود والرسائل، ويتزايد مع كل تفاعل.

إذا حدثت تغييرات في مستوى النظام أو المشروع أثناء الحوار، يجب إعادة تخزين كل المحتوى من البداية. هذه العملية تعتبر «الأكثر تكلفة». تخيل أنك وصلت إلى الرسالة رقم 16، وفجأة غيرت الإشعار النظامي، أو توقفت ساعة، فكل الرموز من الرسالة الأولى ستُعاد معالجتها من جديد.

الخلط بين 1 ساعة و5 دقائق

هذه أكثر نقطة قد تثير سوء فهم.

اشتراك Claude Code: مدة صلاحية التخزين المؤقت الافتراضية ساعة واحدة.

API الخاص بـ Claude: مدة صلاحية الافتراضية 5 دقائق. يمكنك دفع تكلفة إضافية لرفعها إلى ساعة واحدة.
الوكيل الفرعي في أي خطة: دائمًا 5 دقائق.

الدردشة على موقع Claude.ai: لا توجد توثيقات رسمية واضحة. ربما تكون مشابهة للاشتراك، لكن لم أتحقق بعد.

قبل عدة أشهر، اشتكى الكثيرون من أن استهلاك حصة Claude كان سريعًا جدًا. ظنوا أن أنثروبيك خفضت سرًا مدة الصلاحية من ساعة إلى 5 دقائق دون إشعار. لكن الحقيقة أن مدة صلاحية Claude Code لا تزال ساعة واحدة.

المشكلة أن توثيقات Claude Code و API منفصلتان، وهما في الأصل شيئان مختلفان تمامًا، مما أدى إلى الكثير من الالتباس.

إذا كنت تستخدم الوكيل الفرعي بكثرة، أو تستخدم API مباشرة، فإن مدة 5 دقائق مهمة جدًا. لكن بالنسبة لـ 95% من مستخدمي Claude Code، فإن النافذة الحقيقية التي يجب الانتباه إليها هي ساعة واحدة فقط.

ثلاث عادات تغطي 95% من المستخدمين

هذه هي العادات التي أعتقد أنها فعالة جدًا في الاستخدام اليومي.

لا توقف لفترة طويلة

إذا بقيت غير نشط لأكثر من ساعة، فإن المحتوى السابق يكون قد انتهت صلاحيته تقريبًا من التخزين المؤقت. ستقوم الرسالة التالية بإعادة بناء التخزين. في هذه الحالة، من الأفضل أن تقوم بانتقال واضح، ثم تبدأ جلسة جديدة، حيث يكون التكاليف عادة أقل.

عند تغيير المهمة، ابدأ من جديد مباشرة

/compact أو /clear يدمّران التخزين المؤقت بشكل طبيعي، لذا من الأفضل أن تستخدمهما عند الحاجة لإعادة التهيئة.

لقد أنشأت مهارة تسليم الجلسة (session handoff) كبديل لـ /compact. تلخص ما أنجزناه، وما تبقى من قرارات، وأهم الملفات، وأين نتابع. ثم أستخدم /clear وألصق هذا الملخص، لأواصل دون انقطاع.

أمر compact أحيانًا يكون بطيئًا، لكن هذه المهارة عادةً لا تستغرق أكثر من دقيقة.

في دردشة Claude، يُفضل وضع المستندات الكبيرة في Projects

آلية التخزين المؤقت على Claude.ai غير موثقة بشكل تفصيلي، لكن Projects واضح أنها تستخدم تحسينات مختلفة عن المحادثات العادية. لذلك، إذا كنت تلصق مستندات كبيرة، من الأفضل وضعها في Project بدلاً من إدراجها مباشرة في الحوار.

ما الذي قد يكسر التخزين المؤقت بشكل غير ملحوظ؟

بعض الأمور قد تعيد ضبط التخزين المؤقت دون تنبيه واضح.

تغيير النموذج: لأن التخزين يعتمد على مطابقة البادئة، وكل نموذج لديه تخزينه الخاص. عند التبديل، لن يكون هناك أي استدعاء مخزن، وسيتم إعادة قراءة التاريخ بالكامل.

وضع «Opus plan»: يستخدم هذا الوضع Opus في مرحلة التخطيط، وSonnet في التنفيذ. لقد أوصيت به في بعض فيديوهات تحسين الرموز، وله أسباب. لكن من المهم أن تفهم أن كل تغيير في الخطة هو في جوهره تغيير في النموذج، مما يتطلب إعادة بناء التخزين. على المدى الطويل، يساعد ذلك على تمديد حصة المحادثة، لكن عليك أن تعرف ما يحدث في الأساس.

تعديل ملف CLAUDE.md أثناء الحوار ممكن، لكنه لن يُؤثر إلا بعد إعادة التشغيل التالية. لذلك، لن يتأثر التخزين المؤقت الجاري.

لوحة تحكم الرموز المجانية

الصورة التي عرضتها سابقًا تأتي من لوحة تحكم الرموز.

https://github.com/nateherkai/token-dashboard

هذا مستودع GitHub بسيط. يمكنك أن تعطي الرابط لـ Claude Code ليقوم بنشره على localhost، وسيقرأ جميع سجلات محادثاتك السابقة، بدلاً من البدء من الصفر. ستتمكن من رؤية بيانات الإدخال والإخراج والتخزين المؤقت يوميًا.

لكن، يجب أن تنتبه إلى أن هذه اللوحة تتعقب الرموز على الجهاز المحلي فقط. إذا انتقلت من جهاز مكتبي إلى لابتوب، فإن الأرقام لن تتطابق تمامًا. كل جهاز لديه إحصائياته الخاصة.

الخلاصة

التخزين المؤقت للمحفزات هو موضوع يمكن دراسته بعمق. مقال ثاريق يغطي الموضوع بشكل أكثر تفصيلًا، وإذا أردت الاطلاع على الصورة الكاملة، فالأفضل أن تقرأه.

لكن، لست بحاجة لفهم كل التفاصيل للاستفادة. فقط عليك أن تتقن أهم 80/20: الرموز المخزنة أرخص بعشرة أضعاف من الرموز العادية؛ مدة صلاحية Claude Code ساعة واحدة؛ تغيير النموذج قد يكسر التخزين؛ والتسليم الواضح بين المهام غالبًا أكثر فاعلية من الانتظار حتى تنتهي صلاحية جلسة قديمة وإعادة استخدامها لاحقًا.

[رابط النص الأصلي]

انقر لمعرفة المزيد عن فرص العمل في BlockBeats

انضم إلى المجتمع الرسمي لـ BlockBeats:

قناة تليجرام: https://t.me/theblockbeats

مجموعة تليجرام: https://t.me/BlockBeats_App

حساب تويتر الرسمي: https://twitter.com/BlockBeatsAsia

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 8
  • 2
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
RouterWhisperer
· منذ 2 س
إعادة استخدام التخزين المؤقت هو جوهر خفض التكاليف، 300 مليون توكن في أسبوع أمر مبالغ فيه جدًا
شاهد النسخة الأصليةرد0
YieldGoblin
· منذ 11 س
جودة ترجمة BlockBeats دائمًا عالية، هذه المقالة المفيدة
شاهد النسخة الأصليةرد0
GateUser-047cb6fc
· منذ 11 س
توفير التوكن = توفير المال، تعلم هذه العملية الآن
شاهد النسخة الأصليةرد0
Mint-ColoredSlippage
· منذ 11 س
ليس التوكن هو الثمن، بل استخدامه بشكل غبي، أليس التخزين المؤقت أكثر فائدة؟
شاهد النسخة الأصليةرد0
TheWindOnTheBridgeIsTooStrong.
· منذ 12 س
المعرفة الداخلية التي كتبها أنثروبيك زملاؤه، ذات قيمة مرجعية عالية
شاهد النسخة الأصليةرد0
0xSecondThought
· منذ 12 س
أخيرًا فهمت لماذا فاتورة Claude Code الخاصة بي كانت فادحة جدًا
شاهد النسخة الأصليةرد0
MetalKeyInsomnia
· منذ 12 س
تم أخيرًا العثور على قاتل المحادثة الطويلة
شاهد النسخة الأصليةرد0
SoftRugDetective
· منذ 12 س
إعادة استخدام سياق النظام، أليس هذا هو نسخة LLM من Redis؟
شاهد النسخة الأصليةرد0
  • مُثبت