لا تزال النماذج الكبيرة تتنافس على المعلمات، لكن الشيء الذي بدأ فعلاً يحدد سقف الصناعة هو تخزين السياق.


عندما تتغير طول الاستدلال، وسلسلة استدعاء الوكيل، والذاكرة طويلة المدى، فإن العامل الحقيقي الذي يحدد التجربة والتكلفة ليس فقط القدرة الحسابية، بل هو "هل يمكن قراءة وكتابة وتوجيه وإعادة استخدام السياق بكفاءة". ولهذا السبب، بدأ السوق مؤخرًا يركز على بنية تحتية مثل ذاكرة السياق، وذاكرة KV، وتخزين الاستدلالات بشكل هرمي.
في المرحلة القادمة من منافسة الذكاء الاصطناعي، قد يكون التحدي ليس في من يستطيع توليد المزيد من المحتوى، بل في من يمكنه جعل النموذج يعمل بشكل مستمر ومستقر وبتكلفة منخفضة في المهام الأطول.
إذا كانت فترة التدريب تتنافس فيها على GPU، فإن عصر الوكيل (Agent) يتنافس فيه على الذاكرة.
وهذا هو السبب في أنني ناقشت في مجموعة مع الأصدقاء لماذا يستحق الكركند اللعب، وقلت إن كود كلود موجه خصيصًا للكركند. لكنهم قالوا إن مسألة السياق الكامل، لم أجد جوابًا لها، فبقيت أعمل بجد وأعتني بالكركند.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.35Kعدد الحائزين:2
    1.69%
  • القيمة السوقية:$2.23Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.23Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.23Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.23Kعدد الحائزين:1
    0.00%
  • تثبيت