هل انتهى عصر التسعير المرتفع للذكاء الاصطناعي؟ خمسة أسباب هيكلية لانخفاض أسعار الرموز المميزة (Token) حتمًا

تحسن الأداء يتناقص تدريجيًا، تكلفة النماذج مفتوحة المصدر تعادل عُشر التكلفة فقط، الرقائق المخصصة تخفض تكاليف الاستدلال، تكلفة التبديل الصفرية تسمح للمستخدمين بالانتقال الفوري، النماذج المحلية قد تنهي نظام الاشتراك خلال 4-5 سنوات. هل تتقلص مساحة شركات الذكاء الاصطناعي الكبرى للحفاظ على الأسعار المرتفعة بسرعة؟
(خلفية سابقة: نموذج GPT-5.6 Sol الحصري من OpenAI يصل إلى Cerebras، "سيرينيتي" المستثمر ذو الشعر الأبيض يصرخ "تم التحقق من التكنولوجيا" للدخول في القاع)
(خلفية إضافية: Citrini Research: تجنب فقاعة الذكاء الاصطناعي! أشر إلى "5 مناطق عمياء للربح الفاحش" لاستقبال تدفق رأس المال)

جدول المحتويات

Toggle

  • هجوم مزدوج من سقف الأداء والمصادر المفتوحة
  • ثورة الرقائق وتكلفة التبديل الصفرية
  • النماذج المحلية: تهديد نهائي لنظام الاشتراك

يشير مهندس البرمجيات Aditya Patadia في مدونته الشخصية إلى أن Uber أحرقت ميزانية الذكاء الاصطناعي السنوية بالكامل في 4 أشهر، وأعلنت Microsoft وSalesforce وGitHub أيضًا عن نيتها التحكم في إنفاق موظفيها على الذكاء الاصطناعي، وهذه مشكلة مشتركة للصناعة بأكملها، وليست مشكلة انضباط مالي لشركة فردية. لكنه يتوقع أن هيكل التسعير الباهظ لشركات الذكاء الاصطناعي الرائدة حاليًا على وشك الانعكاس.

هجوم مزدوج من سقف الأداء والمصادر المفتوحة

الملاحظة الأولى لباتاديا: تحسن أداء النموذج يتناقص تدريجيًا. كل تكرار للنموذج يحقق تقدمًا، لكن حجم التقدم يتقلص، ومشكلة بيانات التدريب هي مشكلة هيكلية، حيث أن مختبرات الذكاء الاصطناعي الكبرى ربما استهلكت تقريبًا كل المعرفة المكتوبة القابلة للرقمنة في تاريخ البشرية، مما يجعل تحسين مجموعة التدريب أمرًا صعبًا للغاية.

يستشهد بتسعير Claude Opus 4.8 وClaude Opus 4.7 بنفس السعر كدليل: عندما لا يستطيع النموذج إظهار قفزة ملحوظة بين الأجيال، تختفي أسباب رفع الأسعار، ويبقى فقط طريق خفض الأسعار للمنافسة.

الضغط الثاني يأتي من معسكر المصادر المفتوحة. يأخذ GLM-5.2 كمثال، هذا النموذج مفتوح المصدر يعادل GPT 5.5 وClaude Opus في اختبارات البرمجة المعيارية، لكن سعره هو عُشر سعر GPT 5.5 فقط، مما يخلق ميزة ساحقة في التسعير.

استنتاج باتاديا: طالما استمرت النماذج مفتوحة المصدر في تقليص فجوة الأداء مع النماذج المغلقة الرائدة، ستستمر مساحة تسعير النماذج المغلقة في الانكماش.

ثورة الرقائق وتكلفة التبديل الصفرية

خط ضغط آخر على تسعير الذكاء الاصطناعي يأتي من طبقة الأجهزة. يشير باتاديا إلى أن الرقائق المتخصصة للذكاء الاصطناعي التي طورتها شركات مثل Cerebras وGroq وGoogle تعيد كتابة حدود تكاليف الاستدلال. على سبيل المثال، Google TPU تكلفة الاستدلال أرخص بنسبة 30% إلى 70% من Nvidia H100 GPU.

ببساطة، نفس كمية الحساب يمكن أن توفر الكثير من المال باستخدام الشريحة المناسبة، وهذا الفرق يضغط بشكل مباشر على الحد الأدنى لتسعير مزودي خدمة النماذج. بالإضافة إلى الرقائق، هيكل النموذج نفسه يخفض التكاليف: آليات التخزين المؤقت تجعل الاستعلامات المتكررة لا تحتاج إلى إعادة حساب، وهندسة الخبراء المختلطة MoE، بمعنى آخر تجعل النموذج يستدعي جزءًا فقط من "الخبراء" حسب الحاجة، بدلاً من تحريك جميع الخلايا العصبية في كل مرة، مما يقلل بشكل كبير من عبء الحساب مع الحفاظ على نفس مستوى الدقة.

هناك نقطة أخرى يعتبرها باتاديا العامل الهيكلي الأكثر استهانة: تكلفة التبديل الصفرية.

مقارنته مباشرة: خنادق الحماية لبرامج مثل Windows وAdobe وSalesforce تكمن في أن استبدالها مكلف للغاية، وغالبًا ما يتطلب عدة أشهر من عمليات النقل؛ نماذج الذكاء الاصطناعي لا تحتوي على هذه الخنادق. خدمات مثل OpenRouter.ai تسمح للمطورين بتبديل مزود النموذج في بضع ثوانٍ، ويمكن حتى برمجيًا جعل النظام يتحول تلقائيًا بين مزودين مختلفين.

عندما يمكن استبدال المنتجات المنافسة في ثوانٍ، فإن أي محاولة لرفع الأسعار من أي مزود ستؤدي إلى فقدان المستخدمين مباشرة.

النماذج المحلية: تهديد نهائي لنظام الاشتراك

أكثر توقعات باتاديا جرأة تشير إلى النماذج المحلية. تقديره هو خلال 4-5 سنوات: استمرار تحسن أداء الرقائق مع انخفاض حتمي في أسعار الذاكرة (RAM) سيجعل أجهزة الكمبيوتر والهواتف الذكية على مستوى المستهلك قادرة على تشغيل نماذج اللغة محليًا. ويتوقع أيضًا أن أنظمة التشغيل الرئيسية ستضم واجهة نشر النماذج، مما يسمح للتطبيقات المحلية باستدعاء النماذج المحلية مباشرة.

ماذا يعني هذا السيناريو إذا تحقق؟ النماذج السحابية ستصبح ضرورية فقط للمهام الأكثر تعقيدًا: تحليل الوثائق القانونية، الاستدلال طويل السياق، التكامل عبر قواعد البيانات. مهام مثل الإكمال التلقائي للكود، التدقيق في الملفات، التحقق الأساسي من الحقائق، ستُنجز محليًا، ولن تحتاج إلى اشتراك سحابي شهري بقيمة 20$ أو حتى 200$.

بالطبع، باتاديا نفسه يضع علامة على أن هذا "توقع" وليس حقيقة مؤكدة، ويعلن أنها "رهاناته الجريئة"، وسيعطي الوقت الإجابة. لكن كل من اتجاهات الضغط الخمسة هذه - تناقص الأداء الحدي، صعود البدائل مفتوحة المصدر، خفض التكاليف عبر الرقائق المتخصصة، تكلفة التبديل الصفرية، استبدال النماذج المحلية - كل منها مدعوم بأمثلة واقعية، وليست مجرد تجارب فكرية.

إذا كان توقع باتاديا صحيحًا، فهذا خبر جيد للمستخدمين؛ أما بالنسبة لشركات الذكاء الاصطناعي التي تتقاضى أموالًا، فهذا أمر آخر.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت