جارتنر: ستنخفض تكاليف الاستدلال على النماذج اللغوية الكبيرة بأكثر من 90% بحلول عام 2030

يذكر موقع Gartner أنه بحلول عام 2030، ستنخفض تكلفة إجراء الاستدلال على نماذج لغوية كبيرة (LLM) بحجم تريليون معلمة بأكثر من 90% مقارنةً بعام 2025، ما سيتيح لمقدمي الذكاء الاصطناعي التوليدي (GenAI) توفير قدر كبير من التكاليف.

رمز الذكاء الاصطناعي هو وحدة البيانات التي يعالجها نموذج ذكاء اصطناعي توليدي. في هذه الدراسة، يعادل الرمز 3.5 بايت من البيانات، أي قرابة 4 أحرف.

قال كبير محللي Gartner Will Sommer: “ستعود هذه التخفيضات في التكاليف إلى مجموعة من العوامل، منها تحسين كفاءة أشباه الموصلات والبنية التحتية، والابتكار في تصميم النماذج، ورفع استغلال الشريحة، والمزيد من استخدام شرائح استدلال مخصصة لحالات استخدام بعينها، وكذلك تطبيق الأجهزة الطرفية في سيناريوهات محددة”.

ونظرًا لتأثير هذه الاتجاهات، تتوقع Gartner أنه بحلول عام 2030، ستكون فعالية التكلفة لنماذج اللغات الكبيرة أعلى بما يصل إلى 100 مرة من فعالية نماذجها المبكرة من نفس الحجم التي تم تطويرها في عام 2022.

تُقسَّم نتائج نموذج التنبؤ إلى مجموعتين من سيناريوهات أشباه الموصلات:

سيناريوهات متقدمة: تُعالج النماذج بيانات محاكاة مبنية على شرائح أحدث.

سيناريوهات هجينة تقليدية: تُعالج النماذج بيانات محاكاة مبنية على التركيبة المعتادة لأشباه الموصلات الحالية، والتي تم تقييمها بالاستناد إلى بيانات تنبؤ صادرة عن شركة Gartner للاستشارات.

في سيناريو “الـهجينة”، تكون التكاليف المحسوبة أعلى بشكل واضح من سيناريو “المتقدمة”.

سيناريوهات التنبؤ بتكاليف الاستدلال للذكاء الاصطناعي العام

لن تؤدي خفض التكاليف إلى إتاحة التقنيات الذكية المتقدمة على نطاق واسع

ومع ذلك، فإن انخفاض أسعار رموز مقدمي خدمات الذكاء الاصطناعي التوليدي لا يُحوَّل بالكامل إلى العملاء من الشركات. بالإضافة إلى ذلك، ستكون كمية الرموز المطلوبة للتطبيقات الذكية المتقدمة أعلى بكثير من الكمية المستخدمة في التطبيقات السائدة الحالية. فعلى سبيل المثال، فإن عدد الرموز اللازمة لإنجاز كل مهمة بواسطة نموذج الوكيل يبلغ بين 5 إلى 30 مرة من عدد الرموز التي يحتاجها روبوت الدردشة التوليدي القياسي للذكاء الاصطناعي، كما يمكنه تنفيذ مهام أكثر من تلك التي ينجزها الذكاء الاصطناعي التوليدي باستخدام الإنسان.

في حين أن التكلفة المنخفضة لكل وحدة رمز ستمنح الذكاء الاصطناعي التوليدي الأكثر تقدمًا قدرات أقوى، فإن هذه التطورات ستؤدي إلى زيادة كبيرة في الطلب على الرموز. وبسبب أن معدل استهلاك الرموز أسرع من معدل انخفاض تكلفة الرموز، من المتوقع أن ترتفع التكلفة الإجمالية للاستدلال.

قال Sommer: “لا ينبغي لقادة المنتجات الرئيسيين الخلط بين تراجع قيمة الرموز المُسلعَة وبين إتاحة الاستدلال المتقدم على نطاق ديمقراطي. مع اقتراب تكلفة تقنيات الذكاء المُلَكَّنة من الصفر، ستظل موارد الحوسبة والأنظمة اللازمة لدعم الاستدلال المتقدم شحيحة جدًا. أولئك الذين كانوا يحاولون معالجة مشكلات كفاءة البنية المعمارية باستخدام رموز رخيصة اليوم، سيجدون صعوبة غدًا في تحقيق توسع واسع للاستقلالية.”

ستحصل المنصة القادرة على تنسيق معالجة أحمال العمل عبر مختلف النماذج على قيمة. يجب أن تُسند المهام المعتادة والعالية التواتر إلى نماذج لغوية صغيرة وأكثر كفاءة ومخصصة لمجالات بعينها، لأنها تستطيع إنجاز المهام ضمن سير عمل محدد بأداء أفضل، وبكلفة لا تتجاوز جزءًا صغيرًا من كلفة الحلول العامة. يجب تقييد الاستدلال عالي التكلفة للنماذج على مستوى متقدم بدقة، واستخدامه حصريًا للمهام عالية الربح والمعقدة التي تتطلب استدلالًا.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.3Kعدد الحائزين:2
    0.16%
  • القيمة السوقية:$2.28Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.26Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.26Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • تثبيت