من خفض الأسعار الجماعي إلى رفعها الجماعي، لماذا تغير اتجاه "اقتصاد الرموز" بشكل مفاجئ خلال عامين

كيف يمكن لتطبيقات الذكاء الاصطناعي والوكيل الذكي أن تثير طفرة في طلب التوكن؟

التوكن هو “عملة جديدة” في عصر الذكاء الاصطناعي. في عام 2024، بدأت حرب الأسعار في الذكاء الاصطناعي، حيث يُقيم التوكن بـ"عشري"؛ وفي عام 2026، ستشهد الطلب على القدرة الحاسوبية انفجارًا، مع ارتفاع أسعار التوكن بشكل جماعي من قبل مطوري النماذج ومزودي الخدمات السحابية.

خلال العامين الماضيين، شهد قطاع النماذج الكبيرة تحولات حادة من حرب الأسعار إلى حرب القيمة، حيث يُعاد تقييم قيمة التوكن. بالإضافة إلى الأجور والمكافآت وحقوق الملكية، أصبح التوكن حتى ورقة مساومة جديدة في مفاوضات رواتب مهندسي وادي السيليكون. وقد بدأت معركة تنظيم البيئة المحيطة بالتوكن والموارد.

من موجة خفض الأسعار إلى موجة رفعها

في عام 2026، ارتفعت أسعار التوكن بشكل جماعي من قبل مطوري النماذج ومزودي الخدمات السحابية. منذ بداية العام، أصدرت شركة Zhipu إعلانين لرفع الأسعار. في 16 مارس، أطلقت نموذجًا أساسيًا موجهًا لتحسين عميق لمشهد OpenClaw، وهو النموذج GLM-5-Turbo، مع زيادة سعر API بنسبة 20%. في باقة “الروبيان” الموجهة للمستخدمين الأفراد والمؤسسات، كانت بطاقة الشهر 39 يوانًا/شهر، تشمل 35 مليون توكن، أما بطاقة الاشتراك المتقدم فكانت 99 يوانًا/شهر، وتشمل 100 مليون توكن. في فبراير، أصدرت Zhipu إعلانًا لرفع أسعار خطة التكويد، موضحًا أن الطلب على خطة التكويد من قبل السوق يواصل النمو بقوة، مع زيادة سريعة في حجم المستخدمين وعدد الطلبات، وقررت إلغاء عروض الشراء الأولي، مع الاحتفاظ بعروض الاشتراك الموسمية والسنوية، مع زيادة عامة في الأسعار بنسبة تبدأ من 30%.

بالإضافة إلى مطوري النماذج، فإن مزودي الخدمات السحابية يرفعون الأسعار أيضًا بشكل جماعي. بسبب الطلب الكبير على خطة التكويد، زادت شركة Alibaba Cloud من حجم استدعاءات واجهة برمجة التطبيقات للنماذج، وأعلنت في 4 مارس عن تعديل مؤقت لعروض الشراء الأولي، مع تقييدها بوقت محدود يوميًا، مع نفاد الكمية. في 18 مارس، أعلنت Alibaba Cloud أن تكلفة شراء الأجهزة الأساسية، بسبب انفجار الطلب العالمي على الذكاء الاصطناعي وارتفاع أسعار سلاسل التوريد، قد زادت بشكل ملحوظ، وأنها ستقوم بتعديل أسعار خدمات القدرة الحاسوبية للذكاء الاصطناعي وCPFS (نسخة الذكاء الحسابي) وغيرها بدءًا من 18 أبريل. كما ارتفعت أسعار بطاقات القدرة الحاسوبية مثل “PingTouGe” ZhenWu 810E بنسبة 5%-34%، وارتفعت أسعار CPFS (نسخة الذكاء الحسابي) بنسبة 30%.

وأعلنت Baidu Cloud أيضًا أنه ابتداءً من 18 أبريل، ستتم زيادة أسعار منتجات وخدمات القدرة الحاسوبية للذكاء الاصطناعي بنسبة تتراوح بين 5% و30%، مع زيادة حوالي 30% في خدمات التخزين الموازية للملفات. وأعلنت Tencent Cloud أنه ابتداءً من 13 مارس، أن نماذج GLM 5، MiniMax 2.5، Kimi 2.5 ستنهي المرحلة التجريبية وتتحول إلى خدمات تجارية رسمية، مع احتساب الرسوم حسب استدعاء النموذج. كما تم تعديل أسعار نماذج سلسلة “HunYuan”، حيث ارتفع سعر إدخال نموذج Tencent HY2.0 Instruct من 0.0008 يوان/ألف توكن إلى 0.004505 يوان/ألف توكن، وسعر الإخراج من 0.002 يوان/ألف توكن إلى 0.01113 يوان/ألف توكن.

ومع ذلك، قبل عامين، لا تزال ذاكرة موجة خفض الأسعار للتوكن حاضرة.

في معركة النماذج الكبيرة لعام 2024، كانت صناعة النماذج لا تزال في خضم حرب أسعار شرسة، حيث تنافس مزودو الخدمات السحابية ومطورو النماذج على خفض الأسعار وتقديم التوكن مجانًا.

في مايو من ذلك العام، أشعلت ByteDance حرب أسعار النماذج الكبيرة بسعر 0.0008 يوان/ألف توكن، تلتها Alibaba Cloud التي أعلنت عن خفض سعر نموذج Tongyi Qianwen بنسبة تصل إلى 97%. في ذلك الوقت، انخفض سعر إدخال النموذج الرئيسي Qwen-Long، الذي يعادل GPT-4، من 0.02 يوان/ألف توكن إلى 0.0005 يوان/ألف توكن. في نفس الفترة، زادت شركة Zhipu من حصة التوكن المجانية للمستخدمين الجدد من 5 ملايين إلى 25 مليون توكن.

وقد أظهر DeepSeek، الذي يُدرّب نماذج عالية الأداء بتكلفة منخفضة، في مارس من العام الماضي، معلومات رئيسية عن نظام الاستدلال V3/R1 الخاص به، حيث من خلال تحسين الإنتاجية والتأخير، يمكن أن تصل نسبة الربح إلى 545% إذا تم حساب جميع التوكنات وفقًا لأسعار DeepSeek-R1.

التقنية هي أساس خفض أسعار النماذج. قال Tan Dai، رئيس منصة الخدمات السحابية التابعة لـ ByteDance، في موجة خفض الأسعار لعام 2024، إن المنطق الأساسي هو الثقة في القدرة على تقليل التكاليف باستخدام الوسائل التقنية، وأن السوق يحتاج إلى نماذج أكبر وأرخص.

قال Tian Feng، رئيس معهد Quickslow، والمؤسس السابق لمعهد SenseTime للصناعات الذكية، إن الطلب على القدرة الحاسوبية قبل عامين كان أكثر من الشركات، لكنه الآن أصبح “جائعًا” للأفراد، مما دفع الشركات الناشئة في الذكاء الاصطناعي والشركات الكبرى إلى تحويل نماذج أعمالها نحو استهلاك التوكن.

خلال العامين الماضيين، تطورت النماذج بسرعة، وزادت تطبيقات الوكيل الذكي بشكل كبير، مما أدى إلى استمرار ارتفاع الطلب على القدرة الحاسوبية، مع محدودية قدرة بطاقات الاستدلال عالية الكفاءة، وارتفاع تكاليف المكونات الأساسية والبنية التحتية ذات الصلة. قال Bernard Golden، المدير التنفيذي لشركة Navica للاستشارات والاستثمار وتحليل التكنولوجيا في وادي السيليكون، إن الصناعة بأكملها تبحث بشكل مجنون عن المزيد من القدرة الحاسوبية.

وفي ظل اختلال التوازن بين العرض والطلب، أصبح رفع الأسعار أمرًا لا مفر منه.

قال Zhang Peng، الرئيس التنفيذي لشركة Zhipu، مؤخرًا، إن “نموذجًا أكثر ذكاءً ينفذ مهامًا أكثر تعقيدًا، ويستهلك موارد هائلة”. وأوضح أن عمليات التفكير والاستنتاج وراء تنفيذ الوكيل الذكي أطول، وأنه يتفاعل مع البنية التحتية الأساسية عبر كتابة الكود، ويقوم بضبطها وتصحيح الأخطاء بشكل مستمر، وأن كمية التوكن المطلوبة لإنجاز مهمة واحدة تتجاوز بكثير تلك اللازمة للإجابة على سؤال بسيط. وأكد أن تعديل الأسعار هو في الأساس تغير في التكاليف، وأن النماذج الأكبر والأكثر قدرة تتطلب تكاليف خدمة أعلى، لذلك يأملون في إعادة وضعها تدريجيًا إلى نطاق قيمة تجارية طبيعية، وأن الاعتماد على الأسعار المنخفضة على المدى الطويل ليس مفيدًا لصناعة النمو.

نمو حجم استدعاء التوكن بمقدار ألف مرة خلال عامين

خلال العامين الماضيين، قامت مزودات البرمجيات، عبر واجهات برمجة التطبيقات الموحدة، بدمج قدرات توليد النصوص والصور والصوت في منصات خدمة العملاء، ومواد التسويق، والروبوتات الخدمية، وغيرها من المنتجات الحالية. يمكن للمؤسسات استدعاء قدرات النماذج الكبيرة عبر واجهات برمجة التطبيقات، مع احتساب الرسوم حسب حجم الاستدعاء أو الاشتراك، مما يقلل من عتبة الاستخدام والاستثمار المسبق. فتكلفة بطاقة H100 واحدة تقدر بحوالي 25,000 دولار، وتكاليف تركيب عدة بطاقات في نظام واحد أعلى بكثير.

هذه النمط من الخدمة يتيح للنماذج الكبيرة الوصول بسرعة إلى عدد هائل من المستخدمين، مع ارتفاع كبير في حجم استدعاءات التوكن. وكشف Liu Liehong، مدير مكتب البيانات الوطني، مؤخرًا، أنه بحلول نهاية عام 2025، تم بناء أكثر من 100 ألف مجموعة بيانات عالية الجودة في الصين. وحتى مارس من هذا العام، بلغ متوسط استدعاء التوكن اليومي في الصين أكثر من 140 تريليون، بزيادة أكثر من ألف مرة عن بداية 2024، وارتفع بنسبة أكثر من 40% مقارنة بنهاية 2025، حيث كان 100 تريليون.

قال Tian Feng لـ Pengpai Tech إن الطلب على القدرة الحاسوبية للتدريب تجاوز 50% في 2024، وأن الوضع سيعكس تمامًا في 2025. وإذا كانت قبل عامين معركة المئة نموذج، فإن الآن معركة المئة “روبيان”.

إن الطلب الكبير على الاستدلال، وارتباط خدمات الاستدلال بشكل عميق باستهلاك التوكن، هو أكبر وأسرع سيناريو للقدرة الحاسوبية حاليًا. إن أداء النماذج المستمر في التحسن يدفع استهلاك التوكن للارتفاع، وانتشار تطبيقات الذكاء الاصطناعي البرمجي و"الروبيان" (OpenClaw) يجعل الطلب على التوكن ينفجر. يُطلق على OpenClaw لقب “ثقب أسود للتوكن”. بالنسبة للشركات والأفراد الذين يستخدمون “الروبيان”، التوكن هو أكبر عائق في التكاليف.

قال Tian Feng إن استهلاك التوكن عند تنفيذ الوكيل الذكي تلقائيًا هو من 4 إلى 15 مرة أكثر من الأسئلة والأجوبة التقليدية. وأوضح أن رواد الأعمال في الذكاء الاصطناعي، مثل Luo Xuan، يحتاجون إلى استهلاك ملايين أو حتى أكثر من التوكنات لإكمال مهام بحث معقدة باستخدام OpenClaw. وللحصول على توكن أرخص، ينصح بتسجيل حسابات جديدة مع مزودي السحابة أو النماذج، للحصول على توكن مجاني، لكنه يظل يقول “التوكن غالي جدًا”.

يستهلك البرمجة والدردشة والأعمال المكتبية، من حيث القدرة الحاسوبية، التوكن أيضًا. ومن ناحية أوسع، فإن توليد الصور المقيّم بعدد الصور، وتوليد الفيديو المقيّم بالمدة والدقة، تستهلك قدرًا هائلًا من القدرة الحاسوبية. ومثال على ذلك، إغلاق شركة OpenAI لتطبيق الفيديو Sora، حيث يتطلب تشغيل خدمات الفيديو استهلاك موارد حسابية هائلة وكهرباء، وهو عبء كبير على أي شركة، وإغلاق Sora يحرر الكثير من الموارد الحاسوبية.

الطلب على القدرة الحاسوبية لا يقتصر على زيادة طلبات وحدات معالجة الرسوميات فحسب، بل يشمل جميع المكونات ذات الصلة، والتي تتأثر أيضًا، وتصبح عاملًا مقيدًا.

قال Tian Feng إن “تبريد، إضاءة، استهلاك الكهرباء للخوادم، وتكلفة الكهرباء لمراكز البيانات تمثل حوالي 60%، والآن أسعار النفط والغاز الطبيعي في ارتفاع، ودوام ارتفاع أسعار الذاكرة لمدة 5 سنوات”. وأكد أن تكاليف الطاقة والأجهزة تدفع لارتفاع أسعار القدرة الحاسوبية.

قال Huang Zhiming، نائب رئيس Cisco ورئيس منطقة الصين الكبرى، إن من الناحية القصيرة، لا يمكن بناء مصانع الأجهزة في شهر أو شهرين، وأن تقلبات العرض والطلب ستستمر لفترة. وأضاف Hou Shengli، نائب رئيس Cisco في الصين، أن تلبية القدرة الإنتاجية للطلب يتطلب حوالي عامين، وأن “تعديلات مصانع الذاكرة تستغرق على الأقل عامين، ولن يتحسن الوضع قبل نهاية 2027، وأن إعادة بناء المصانع وتخطيط خطوط الإنتاج ليست سريعة”. ومع ذلك، يعتقد Huang Zhiming أن مع توسع قاعدة المستخدمين وانتشار التطبيقات، ستنخفض التكاليف تدريجيًا وتصبح أكثر شعبية ورخصًا.

قال Yao Xin، مؤسس شركة PiaoYun Cloud Computing (Shanghai)، إن الحد من قيود الذكاء الاصطناعي والقدرة الحاسوبية لا يكمن في أحدث الشرائح، بل في تقنيات تكنولوجيا المعلومات التقليدية والمكونات المرافقة. على مدى العقد الماضي، استمرت صناعة البنية التحتية التقليدية، مثل الذاكرة والأقراص الصلبة والمفاتيح، في النمو بشكل ثابت يتماشى مع نمو الناتج المحلي الإجمالي العالمي، مع توقعات طلب طويلة الأمد، مما يحدد وتيرة توسع معتدلة. لكن النمو المفاجئ للذكاء الاصطناعي كسر هذا التوازن. زادت شحنات وحدات معالجة الرسوميات بشكل كبير، وتحت ضغط الطلب “التحويلي”، تفوقت القدرة على تلبية الطلب على القدرة الإنتاجية، حيث لم تواكب باقي المكونات. وقال إن القدرة على إنتاج الشرائح عالية الأداء زادت، لكن باقي القدرات لم تتبع، ونتيجة لذلك، زادت الشركات من إنتاج المكونات التقليدية، بما في ذلك الذاكرة والأقراص الصلبة.

تبدل العرض والطلب، واستقرار في النهاية

قال Tian Feng إن “الآن التوكن أغلى من المتدرب، وخلال ثلاث إلى خمس سنوات، سيكون أرخص”. ويعتقد أن سعر التوكن في المستقبل سينخفض بالتأكيد.

ويرى أن، على المدى القصير، ارتفاع أسعار القدرة الحاسوبية ناتج عن عدم التوازن بين العرض والطلب. لكن من منظور دورة أشباه الموصلات، توجد دورة في صناعة التصنيع، حيث بعد التوسع، يتم إطلاق قدرات جديدة مركزة، ويحدث اضطراب في السوق، مما يؤدي إلى انخفاض الأسعار، وحتى فائض في القدرة. من ناحية الطاقة، تعمل الصين على تحويل هيكل الطاقة الجديدة، مما قد يقلل من تكاليف الطاقة بشكل أكبر. وعلى المدى المتوسط، يعتمد السعر على قدرة النموذج الأساسي — حيث أن الإصدارات الجديدة التي تتكرر كل ثلاثة أشهر غالبًا ما تحل المشكلات غير الملباة سابقًا، وتطلق طلبات جديدة، مما يدفع أسعار القدرة الحاسوبية للارتفاع؛ وعلى المدى الطويل، يعتمد على تطور قدرات الاستدلال، مما يؤدي في النهاية إلى انخفاض مستمر في تكاليف القدرة الحاسوبية.

على مدى العامين الماضيين، تكررت الارتفاعات بين جانب العرض والطلب. قال Tian Feng إن DeepSeek يمثل قمة الابتكار في خفض التكاليف، وأن انفجار الإنتاجية في نماذج “الروبيان” يمثل قمة الطلب. لكن هذا لا يعني أن جانب الطلب لم يخفض التكاليف، فقط أن سرعة الانفجار في الطلب أعلى من سرعة انخفاض تكاليف الاستدلال. خلال 3-5 سنوات، ستنخفض تكاليف القدرة الحاسوبية وتكاليف التوكن بشكل حاد.

قال Yao Xin إن الذكاء الاصطناعي دخل “نقطة التفرد”، وأنه خلال سنة أو سنتين، ستشهد نماذج النمو السريع بمقدار عشرة أضعاف أو مائة ضعف، وأن جميع الصناعات غير المستعدة لمواجهة هذا النمو ستواجه نقصًا في العرض على المدى القصير. لكن، كما تتنشر تموجات الماء ببطء، ستستقر في النهاية.

وراء ارتفاع أسعار التوكن، تتغير المنطق التجاري أيضًا. قال Huang Renxun، الرئيس التنفيذي لشركة Nvidia، مرارًا وتكرارًا، إن هيكل “الطبقات الخمس” للذكاء الاصطناعي يتكون من الطاقة، والشرائح، والبنية التحتية، والنماذج، والتطبيقات، مع تقديم أكبر الأرباح الاقتصادية في أعلى طبقة.

قال Huang: “الذكاء الاصطناعي الحالي يشبه مشهد الإنترنت في عام 2000، حين لم يكن واضحًا تمامًا ما يمكن أن يفعله الإنترنت، لكن الكثيرين استثمروا في بناء مواقع متنوعة.” وأوضح أن مع استمرار التطبيق والابتكار، في عام 2005 و2006، ظهرت العديد من سيناريوهات “الإنترنت +”، وتكاملت الخدمات تدريجيًا. كما أن اتجاه تطوير الذكاء الاصطناعي يستحق التوقع، حيث يُتوقع أن يكون عام 2026 عامًا لبداية الوكيل الذكي، مع ظهور تطبيقات الوكيل بشكل متكرر هذا العام.

وتندمج هذه التطبيقات الذكية في الهواتف، وأجهزة الكمبيوتر، وحتى خطوط الإنتاج في المصانع. قال Tian Feng إن “طلب كل شخص لزيادة إنتاجية الذكاء الاصطناعي يكاد يكون لا نهاية له، والشرط الوحيد هو السعر. إذا زاد السعر، ينخفض الطلب؛ وإذا انخفض، يرتفع الطلب.” وأكد أن حتى الآن، لا تتعامل الشركات الكبرى بشكل متساوٍ مع الزيادات في الأسعار. “من ناحية، ترفع الشركات الكبرى أسعار الحوسبة السحابية لعملائها من الشركات، ومن ناحية أخرى، تتبنى استراتيجيات تقديم تجارب مجانية مؤقتة أو منح توكنات لجذب السوق الاستهلاكي.” واعترف Tian Feng أن الوضع الحالي يشبه مبكر الإنترنت، حيث أن الهدف النهائي هو جذب المستخدمين، لكن الأهم هو جذب المطورين.

في الماضي، كان المطورون هم المبرمجون حول العالم، لكن الآن، يمتلك عدد كبير من غير التقنيين قدرات برمجة الأجواء (Vibe Coding). فهم ليسوا فقط مستهلكي الكود، بل مبدعوه أيضًا. إذا تمكنت الشركات الكبرى من السيطرة على المطورين، فسيكون بإمكانها أن تجعل نتائج التطوير تنمو على سحاباتها.

توفر شركات الإنترنت الكبرى في الصين توكنات لموظفيها، لتشجيع استخدام الذكاء الاصطناعي. وفقًا لتقرير من Ji Mian News، فإن Alibaba Group تعمل على خطة داخلية تقدم فيها توكنات لموظفيها، لتشجيعهم على استخدام نماذج وأدوات الذكاء الاصطناعي المتقدمة في العمل. يمكن لموظفي Alibaba استخدام أدوات AI المدفوعة مثل Wukong وQoder، مجانًا، لأغراض البحث والتطوير والأعمال العامة، مع توفير توكنات من قبل الشركة. يمكن للموظفين شراء عضوية Coding Plan أو أدوات تطوير AI خارجية، وطلب تعويض.

استخدام الذكاء الاصطناعي لزيادة الكفاءة لا يقتصر على البرمجة فحسب، بل يشمل أيضًا إنتاج المحتوى المهني والإنتاجية. حتى أن خطة MiniMax تم ترقية من خطة التكويد الأصلية إلى خطة توكن تدعم نماذج MiniMax متعددة الوسائط، للاستفادة من فرص التوكن.

قال Tian Feng بصراحة إن صناعة النماذج لم تجد بعد العديد من الاحتياجات الأساسية، لذلك تعتمد بشكل عام على نموذج الاشتراك الشهري. ويُعد التوكن موضوع اهتمام لأنه يعكس بشكل مباشر معدل نمو الإيرادات من خلال زيادة عدد المستخدمين الشهريين ومتوسط استهلاك التوكن لكل مستخدم. وأضاف أن هذا يخلق ولاءً قويًا للمستخدمين، فطالما كانت المنتجات سهلة الاستخدام، فحتى لو كانت الأسعار مرتفعة قليلاً، فإن المستخدمين مستعدون للدفع مقابل تجربة أفضل. والأهم من ذلك، أن نفس 5 ملايين توكن يمكن أن تُباع مقابل 22 يوانًا أو 400 يوان، مع هامش ربح يتعلق بشكل مباشر بقدرة النموذج الأساسي والوكيل الذكي. وأكد Tian Feng أن جوهر الأمر أن وراء التوكن يوجد منجم ذهب لم يُستغل بعد.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت