"Fable 5 هذا السعر أعلى بكثير من أجر يوم واحد للمبرمج الصيني. كتابة الكود بحرق مئات الآلاف من التوكنات يوميًا هو أمر اقتصادي بالفعل، ثم ترى الفاتورة بآلاف اليوانات الصينية."

هذا هو الواقع الذي يحدث الآن. وفقًا لأحدث البيانات، وصلت نفقات شركة Anthropic على القوة الحاسوبية إلى 2.3 ضعف نفقات الرواتب. بناءً على التكلفة الإجمالية لمهندس كبير تبلغ 224,000 دولار، فإن الإنفاق الحاسوبي لكل مهندس في Anthropic يبلغ حوالي 515,000 دولار سنويًا. هذا يعني: الإنسان ليس أغلى من النموذج.

في مواجهة هذه الفواتير، حتى Claude نفسه اضطر لبدء توفير التوكنات.

Claude Code: حرق التوكنات مقابل وهم "أنا منتج جدًا"

مؤخرًا، ظهر مصطلح جديد في الصناعة: Token Apocalypse (نهاية التوكن).

من token maxing إلى token apocalypse، يشير إلى تحول نموذجي كبير يحدث بالفعل في صناعة الذكاء الاصطناعي. في شهري مارس وأبريل من هذا العام، كان الجميع يتباهون بعدد التوكنات التي استخدموها، بل ويعتبرونها نوعًا من لوحات التصنيف. لكن استخدام الذكاء الاصطناعي لا يعني تلقائيًا توفير المال، لذا بدأ الجميع في التركيز أكثر على تكلفة التوكن الواحد.

الأكثر دقة هو أن النماذج الكبيرة توسع أيضًا نطاق العديد من الأعمال التي لم تكن بحاجة أساسًا إلى الذكاء الاصطناعي. نحن الآن لا نريد قراءة ملفات PDF بأنفسنا، ولا نريد قراءة المقالات الطويلة، ونجعل كل شيء يلخصه الذكاء الاصطناعي. أو نستخدم الذكاء الاصطناعي لتحويل هذه الأشياء إلى شرائح عرض، ثم نرميها لشخص آخر، قد يستخدم هو الآخر الذكاء الاصطناعي لقراءة هذه الشرائح... يبدو أن الذكاء الاصطناعي يضيف طبقة من القيمة إلى بعض الأعمال الهشة بالفعل، بينما يرفع الفاتورة بهدوء.

اليوم، أصبح فقدان السيطرة على التكاليف أمرًا طبيعيًا. بدأت شركات مثل Amazon وAdobe وAtlassian وCitigroup في فرض رقابة صارمة على استخدام الذكاء الاصطناعي:

تقييد مستوى النموذج: بعض الموظفين في الشركات ممنوعون من استخدام نماذج متطورة مثل Claude Opus، ويُجبرون على استخدام إصدارات أرخص؛
وضع حدود شخصية: حددت Uber لكل مهندس حدًا أقصى شهريًا قدره 1,500 دولار للتوكنات؛
إلغاء الأذونات بالكامل: قامت مؤسسات مثل Citibank بتقييد الوصول إلى أدوات الذكاء الاصطناعي المتقدمة تمامًا، ويتم إلغاء حسابات المؤسسات للموظفين الذين لا يحققون أهداف الاستخدام. قبل ذلك، صرح مدير التكنولوجيا في Uber أن الشركة استهلكت ميزانية الذكاء الاصطناعي السنوية في غضون أشهر. كما أوقفت Walmart مؤخرًا استخدام بعض الأدوات.

الشركات الكبرى إما تبحث عن طرق لتوفير المال في كل مكان، أو تضع حدًا فوريًا لإهدار التوكنات. لذلك، يتلقى الموظفون رسائل متناقضة للغاية: من ناحية "الذكاء الاصطناعي يمكن أن يضاعف كفاءتك 100 مرة، يجب استخدامه"، ومن ناحية أخرى "لا تفلس الشركة".

هذه هي المشكلة الأكثر نموذجية في الجولة الأولى من انتشار أدوات الذكاء الاصطناعي: عندما يتم إطلاق الأدوات، لا توجد حواجز كافية لمنع الشركات من إنفاق ملايين الدولارات على نماذج اللغة الكبيرة، ولا توجد آليات لتذكير الفرق بأن التوكنات تحترق بسرعة. سواء كانت روبوتات محادثة أو أدوات برمجة، تضع العديد من المنتجات "القدرة على الاستخدام" في المقام الأول، بينما تُؤجل إدارة التكاليف وحصص الاستخدام وتصنيف النماذج وإدارة السياق إلى وقت لاحق.

لكن Claude Code ليس أداة كفاءة في جوهره، بل هو أداة تسويقية.

هدفه التصميمي واضح: يجعلك تشعر بأنك منتج. بوريس، مدير مشروع Claude Code، كان تفكيره الأولي عند صنع هذا المنتج: "إذا أصبح النموذج ذكيًا بما فيه الكفاية، كيف ستبدو الكود؟ كيف أريد استخدام هذه الأشياء؟" - نقطة الانطلاق ليست "كيف تساعد المطورين على توفير التوكنات"، بل "كيف تعرض ذكاء النموذج".

Anthropic مستعدة لحرق كميات كبيرة من التوكنات مقابل هذا "الشعور" - سواء كانت أموالك أو أموالهم الخاصة. إنفاق 200 دولار في خمس دقائق ليس حادثًا بالنسبة لـ Claude Code، بل هو جزء من التصميم. منطقه الأساسي هو: أي مشكلة يمكن حلها بحرق المزيد من التوكنات، لن نبحث عن طريقة توفر التوكنات. جميع الـ sub-agent، جميع رسوم UI المبهرجة، جميع تتبعات التفكير المطولة (reasoning traces)، كلها ليست من أجل الكفاءة، بل لجعلك تحدق في الشاشة وتشعر بأن "هذا النموذج ذكي حقًا، وقادر حقًا".

وراء هذا هناك حلقة تسويقية مصممة بعناية: تحرق الكثير من التوكنات، وتحصل على شعور "الإنتاجية"، فتعتقد أن Claude جيد، ثم تستمر في استخدامه. Anthropic مستعدة حتى لتحمل تكاليف العديد من التوكنات بنفسها، مقابل هذا الاعتراف العاطفي. هذا هو السبب أيضًا في أن تطبيقات سطح المكتب لديهم تعاني من نقص واضح في الاستثمار - هدف Claude Code لم يكن أبدًا أن يكون أداة جيدة، بل أن يكون "أفضل نافذة عرض" لقدرات نموذج Anthropic.

وهذه الفلسفة التصميمية "حرق التوكنات مقابل التجربة" هي بالضبط ما جعل Claude متخلفًا عن OpenAI في كفاءة التوكنات.

OpenAI كانت تضغط على التوكنات بشراسة. من ضغط تتبعات التفكير (reasoning traces) إلى تحسين كفاءة النموذج نفسه، فلسفتهم هي: استخدام عدد أقل من التوكنات لأداء نفس العمل. Codex 5.5 هو أفضل مثال.

على الرغم من أن نماذج مثل Fable 5 ذكية، إلا أنها ليست فعالة مقارنة بالنماذج الأخرى. هذا الرسم البياني من Deep SWE يوضح الأمر بوضوح. عند مقارنة نفس الدفعة من النماذج، يصبح الأمر أكثر وضوحًا: استخدم GPT-5.5 medium 20,000 توكن فقط وحصل على نتائج مذهلة؛ بينما استخدم Opus 4.8 50,000 توكن وحصل على درجات أقل.

هذا هو التوصيف المباشر لمسارين: الصناعة في حالة ذعر، Claude يحرق، OpenAI يوفر. والسؤال التالي هو - بما أننا بحاجة لخفض التكاليف، ما هو أول شيء يجب تقليصه؟ الجواب: تلك التعليمات (prompts) المتراكمة لفترة طويلة.

ديون Claude Code من التعليمات (Prompt Debt): كلما زاد التكديس، زاد الدين

في أحدث خطاب، أعلنت Anthropic أنها حذفت 80% من تعليمات النظام (system prompts) لـ Claude Code.

وأوضح تارق شيبار، عضو فريق التقنية في Anthropic، أن هذا يعكس تغييرًا جذريًا في طريقة توجيه نماذج الذكاء الاصطناعي - في الماضي، كان يُعتقد أنه كلما زادت التعليمات والأمثلة، كان أداء النموذج أفضل؛ لكن الآن، لم يعد هذا المنطق صحيحًا. النموذج الجديد Fable 5 أكثر إبداعًا من الأمثلة التي قدمناها، والأمثلة أصبحت قيدًا.

هذا بالطبع يحتوي على عنصر تسويقي، حيث مدح قدرات Fable: "الأمثلة تقيد النموذج بسهولة، لأنه في الواقع أكثر إبداعًا من الأمثلة التي نقدمها". لكن هناك حقيقة لا يمكن تجاوزها: حتى Anthropic نفسها بدأت في تقليص system prompts.

فلماذا كانت هناك حاجة إلى الكثير من التعليمات في السابق؟

في العام أو العامين الماضيين، تشكلت عقلية ثابتة في مجال برمجة الذكاء الاصطناعي: كلما كان السياق أكبر، كان أفضل؛ كلما كانت تعليمات الأدوات أكثر، كان أفضل؛ كلما كان system prompt أكثر اكتمالاً، كان أفضل. لا يعرف النموذج كيفية تنظيم المشروع؟ أضف Agents.md. لا يعرف النموذج كيفية استخدام الأداة؟ أضف tool descriptions. النموذج ليس استباقيًا بما فيه الكفاية؟ أضف توجيهات سلوكية. النموذج غير مستقر؟ استمر في إضافة قيود إلى system prompt.

لا يمكن إنكار أن system prompt كان في السابق ميزة تنافسية أساسية لأدوات برمجة الذكاء الاصطناعي. التعديلات الصغيرة على تعليمات LLM يمكن أن تؤدي إلى تحسينات كبيرة في الأداء. إذا شعر النموذج نفسه بشكل مختلف في Codex وCursor وOpenCode وCopilot، فمن شبه المؤكد أن السبب هو اختلافات دقيقة في التعليمات.

هذا هو السبب أيضًا في أن Cursor قضى وقتًا طويلاً في اختبار system prompts، وإجراء اختبارات A/B، وتعديل طرق التعليمات لكل نموذج. بالمقارنة مع استخدام Opus في Claude Code، يمكن لـ harness الخاص بـ Cursor تحسين أداء النموذج بشكل كبير، حيث تصل التحسينات المقاسة في بعض المعايير إلى 10% إلى 30%. الفرق الأساسي غالبًا يكون في بضع فقرات من التعليمات.

لكن المشكلة هي أنه طالما أن التعليمات مفيدة، سيستمر الفريق في إضافة المزيد. نموذج معين يحب استخدام الأدوات بشكل عشوائي، أضف قاعدة؛ نموذج معين ليس استباقيًا كافيًا، أضف تشجيعًا؛ نموذج معين يبحث كثيرًا، أضف قيدًا؛ نموذج معين لا يفهم سياق المشروع، أضف ملف markdown آخر. كل إضافة لها سببها، ولكن مع التراكم الطويل، يصبح system prompt عبئًا سياقيًا كبيرًا دائمًا.

المشكلة هي: system prompt ليس مجانيًا. يتم قراءته وحسابه واحتلال السياق في كل استدعاء.

بعد أن دمج Claude Code جميع الأدوات والوظائف داخليًا، تضخم system prompt في وقت ما إلى 65,000 توكن؛ حتى مع إغلاق معظم الوظائف، كان لا يزال عند 12,000 توكن. بمعنى آخر، قبل أن يبدأ النموذج في كتابة سطر واحد من الكود، كان يحمل بالفعل كتيب تعليمات. على سبيل المقارنة، كان سياق بدء تشغيل Pi أقل من ألف توكن.

والأكثر إزعاجًا هو أن ديون التعليمات (prompt debt) أكثر خفاءً من ديون الكود.

الكود القديم عادةً ما يظهر عند تغيير الوظائف، أو تشغيل الاختبارات، أو معالجة الأخطاء. لكن التعليمات القديمة قد تجعل النموذج يتراجع بهدوء. يرى المستخدم أن "Claude Code لم يعد ذكيًا كما كان مؤخرًا"، أو "النموذج الجديد ليس قويًا كما يُروج له"، لكن السبب الحقيقي قد يكون أن system prompt القديم لم يواكب النموذج الجديد.

عندما تتحول التعليمات من ميزة تنافسية إلى عبء، تختار Anthropic حذف 80% منها، مما يمكن أن يزيد من كفاءة التوكنات.

ضريبة الثرثرة في Claude: كل كلمة زائدة، كل نقود إضافية

Claude Code مليء بالثرثرة حقًا.

هذا العام، أصبح هناك إضافة تسمى Caveman شائعة بسرعة، خصيصًا لحل هذه المشكلة. اسمها المباشر يعني "إنسان كهف"، بمعنى التحدث مثل الإنسان البدائي - لا مجاملات، لا قواعد نحوية زائدة، لا كلمات حشو، فقط المعنى الأساسي.

للوهلة الأولى، يبدو الأمر مزحة. لكن بمجرد فهمه، ستجد أنه يحل مشكلة حقيقية جدًا في LLM: كثرة الثرثرة، كثرة التوكنات، وتكاليف غير ضرورية.

وأصله كان تحديدًا موجهًا لـ Claude Code.

"لقد صنعت Caveman في أوائل أبريل، لأنني كنت أستخدم Claude Code بكثافة في ذلك الوقت، ولاحظت أن الكثير من إنفاقي على التوكنات يذهب إلى كلمات غير ضرورية: المجاملات، الصياغات الغامضة، العبارات الانتقالية، والتعابير التحادثية التي ليست مهمة حقًا في حلقات الوكيل (agent loops)"، قال جوليوس بروسي، منشئ Caveman.

أظهرت تقييمات Brussee أن Caveman يمكن أن يقلل من توكنات المخرجات بنسبة 65% إلى 75% مقارنة بالمخرجات الافتراضية، مع نتائج أفضل من الأمر العادي "كن موجزًا". يقوم بضغط اللغة المحيطة بشكل أساسي، ولا يؤثر على الأجزاء التي تتطلب الدقة مثل الكود والأوامر والمسارات وعناوين URL وأسماء الوظائف.

وفقًا للتقارير، ساهم مدير الهندسة في OpenAI، شاين سويني، أيضًا في كود هذا المشروع لدعم Codex.

والأكثر إثارة للاهتمام هو أن OpenAI قد طبقت هذا النمط اللغوي بالفعل في مرحلة التفكير.

بعض تتبعات التفكير (reasoning traces) المسربة (وليس ملخصات التفكير المعروضة للخارج) كشفت عن ذلك. المحتوى ليس إنجليزيًا عاديًا، بل يشبه اختصارًا هندسيًا مضغوطًا:

"استخدم عقدًا أساسية جديدة. بحاجة لاستنتاج. بحاجة لإضافة تشفير VAE للصور. حاول. حاول فترة."

هذه الجمل تبدو مضحكة، وحتى فوضوية نوعًا ما، لكن تركيزها ليس على القراءة، بل على كفاءة التوكنات. عندما يقوم النموذج بالاستدلال الداخلي، لا يحتاج أن يكون مهذبًا وكاملًا وسلسًا كما لو كان يخاطب المستخدم. يحتاج فقط إلى الاحتفاظ بالإجراءات والأشياء والأحكام والخطوات التالية. بمعنى آخر، طالما أن الإجابة النهائية طبيعية، يمكن للنموذج داخليًا استخدام لغة أقصر وأكثر خشنًا وأوفر للتوكنات لإكمال التفكير، سعيًا وراء أقصى كفاءة للتوكنات.

هذا أكثر فائدة حتى من كتابة التعليمات (prompting). فائدة ضغط توكنات التفكير أكبر، لأن الوكيل (agent) ينفذ خطوات متعددة، حيث يصبح تفكير الخطوة السابقة مدخلاً للخطوة التالية. كلما قل "التفكير" الذي يقوم به النموذج، لا يوفر فقط تلك التوكنات الحالية، بل يوفر التكاليف المتكررة على طول سلسلة التنفيذ بأكملها.

هذا هو الفرق الواضح بين مساري OpenAI وClaude.

كان Claude دائمًا أفضل في المحادثة، وأكثر كمساعد يفكر ويعبر بلغة كاملة. بمجرد النظر إلى تتبعات التفكير (reasoning traces) الأطول بكثير، يمكن التكهن بأنها تستخدم الإنجليزية العادية. مخرجاته وتفكيره غالبًا ما يكونان أطول، لذا يعتمدون على نافذة سياق كبيرة لاستيعاب هذه المحتويات.

هذا هو السبب أيضًا في أن Claude يستخدم افتراضيًا نافذة سياق تبلغ مليون توكن. يعتقد الكثيرون أن هذا لأنه يريد استيعاب قاعدة بيانات أكبر، لكن السبب أبسط: محتوى Claude طويل جدًا، ولا يمكن استيعابه بدون هذه النافذة الكبيرة. حتى في الضغط (compaction) هم سيئون؛ عند استعادة موضوع قديم، ينصحك Claude بعدم الاحتفاظ بالسياق الكامل، بل محاولة الضغط. لأنهم لا يحتفظون بتتبعات التفكير - في الواقع، يقومون بمسح هذه الأشياء بعد 10 إلى 20 دقيقة، لأن كفاءة توكنات التفكير منخفضة جدًا ولا تستحق الاحتفاظ بها، وإلا ستكون التكاليف باهظة وغير مقبولة.

بينما نافذة سياق توكنات نماذج OpenAI تبلغ حوالي 200,000 توكن أو أقل، لكنهم حققوا الضغط من البداية من خلال هذه اللغة القصيرة.

تفصيل يستحق التأمل: إذا قامت Anthropic بإصلاح مشكلة "كثرة الثرثرة"، ستنخفض إيراداتهم بشكل ملحوظ. إذا تمكن المطورون من إكمال نفس العمل باستخدام النموذج ولكن مع عدد أقل من التوكنات المولدة، فهذه أموال لن يتمكنوا من كسبها.

المصدر: InfoQ

إخلاء المسؤولية والمخاطر

السوق ينطوي على مخاطر، يجب توخي الحذر عند الاستثمار. لا تشكل هذه المقالة نصيحة استثمارية شخصية، ولا تأخذ في الاعتبار الأهداف الاستثمارية المحددة أو الوضع المالي أو احتياجات المستخدمين الفردية. يجب على المستخدمين النظر في ما إذا كانت أي آراء أو وجهات نظر أو استنتاجات في هذه المقالة تناسب وضعهم الخاص. الاستثمار بناءً عليها يكون على مسؤوليتهم الخاصة.

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

أعجبني
إعجاب
تعليق
إعادة النشر
مشاركة

تعليق

إضافة تعليق

لا توجد تعليقات

المواضيع الرائجة
عرض المزيد
#
gStocksTokenizedStocksLive
1.08M درجة الشعبية
#
StrongNonfarmPayrollsRekindleRateHikeFear
1.03M درجة الشعبية
#
IsraelStrikesIranBTCPlunges
67.83K درجة الشعبية
#
PredictWorldCupShare20000U
190.87K درجة الشعبية
#
ETHBreaks1700
120.76M درجة الشعبية

مُثبت

خريطة الموقع

ربما يعني أن 80% من تعليمات Claude Code تم حذفها بسهولة، وأن Anthropic أعطت مثالًا باستخدام Fable 5: "خفض التكاليف" في صناعة AI قد بدأ للتو.

Claude Code: حرق التوكنات مقابل وهم "أنا منتج جدًا"

ديون Claude Code من التعليمات (Prompt Debt): كلما زاد التكديس، زاد الدين

ضريبة الثرثرة في Claude: كل كلمة زائدة، كل نقود إضافية

المواضيع الرائجة

gStocksTokenizedStocksLive

StrongNonfarmPayrollsRekindleRateHikeFear

IsraelStrikesIranBTCPlunges

PredictWorldCupShare20000U

ETHBreaks1700

مُثبت