OpenClaw جعل شركات النماذج لأول مرة تتذوق حلاوة اقتصاد الرموز.


17 يونيو، تم إصدار GLM-5.2 كمصدر مفتوح. هذه المرة مختلفة.
اتفاقية MIT: التعديل والبيع بحرية، والواجب الوحيد هو الاحتفاظ بإشعار حقوق النشر.
خطر حقوق الملكية الفكرية صفر، يمكن للشركات أن تدمج النموذج في منتجاتها التجارية بدون قلق، والتعديلات لا تتطلب تسليمها. بالمقارنة مع بروتوكولات مثل GPL التي تتطلب فتح المصدر عند استخدام الكود الخاص بي، فإن MIT تزيل العوائق.
الأهم من ذلك — جميع النماذج، من الآن فصاعدًا، تدخل عصر الاستنتاج الطويل.
ماذا غيرت GLM-5.2 حقًا؟
في عصر OpenClaw، كان وكيل العمل "سباق قصير" — كل مهمة لها نافذة محدودة، تخطيط-تنفيذ-انتهاء، حجم ذاكرة التخزين المؤقت KV قابل للتحكم، والضغط على الأجهزة يتركز على القدرة الحسابية.
أما الاستنتاج الطويل لـ GLM-5.2 فهو "ماراثون" — سياق غير مفقود يبلغ 1 مليون، يمكن للنموذج أن يحتفظ بجميع التعليمات، جميع قرارات التاريخ، وجميع القيود في مهمة واحدة. في الاختبارات الفعلية، مع معالجة 880 ألف رمز، كاد أن يملأ النافذة.
ماذا يعني هذا التغيير؟
في الماضي، كانت الذكاء الاصطناعي "سؤال وجواب" — استهلاك الرموز ينتهي بعد مرة واحدة.
بعد GLM-5.2، بدأ الوكيل في تنفيذ مهام طويلة حقيقية: تقسيم الهدف → تخطيط متعدد الجولات → التحقق المتكرر → ضبط الأدوات → كتابة الكود ثم تشغيله → إعادة التخطيط بناءً على الملاحظات. يتم تكرار مئات مرات من الاستنتاج في مهمة واحدة.
كل دورة، تتطلب تحميل السياق الكامل إلى الذاكرة وإعادة الحساب.
حساب مستمر، اتصال مستمر، قراءة وكتابة مستمرة.
هذه الثلاثة "مستمرة" غيرت تمامًا منطق تسعير الأجهزة.
ماذا يفيد الاستنتاج الطويل للوكيل؟
🥇 HBM
نموذج ذاكرة KV يتزايد خطيًا مع جولات الحوار وطول السياق، مما يستهلك بسرعة سعة ذاكرة HBM على GPU. بمجرد أن يخرج ذاكرة KV من الذاكرة المحلية للـ GPU، ينخفض النطاق الترددي من تيرابايت/ثانية إلى مئات الجيجابايت/ثانية — المشكلة تتحول من "القدرة الحسابية" إلى "عرض النطاق الترددي للذاكرة".
ثلاث شركات كبرى تعاني من نفاد القدرة، الفجوة تتراوح بين 50%-60%، بحلول 2026، حجم السوق 54.6 مليار دولار.
🥈 شرائح الضوء/InP
يتم تشغيل الاستنتاج الطويل في عنقود، وكل دورة تتطلب تزامن بين الأجهزة. كلما كانت المهمة أطول، وكلما زادت الدورات، زاد حجم الاتصالات.
سوق وحدات الضوء في 2026 يقدر بـ 26 مليار دولار، بزيادة سنوية 60%. فجوة شرائح InP تتجاوز 70%، وسعر الإندي ارتفع بنسبة 90% على أساس سنوي.
🥉 المعالج المركزي
المهام الطويلة تتطلب تفكيك مستمر للمهام، استدعاء الأدوات، إدارة العمليات، وجدولة ذاكرة KV. هذه الأعمال لا يمكن للـ GPU أداؤها بشكل جيد، ويجب الاعتماد على الـ CPU.
نسبة استخدام CPU/GPU تتجه من 1:8 نحو 1:1، قال الرئيس التنفيذي لشركة إنتل علنًا "العديد من رؤساء الشركات يتصلون يطالبون بسرعة تزويدهم بـ CPU".
❄️ التبريد بالسائل
الاستنتاج القصير هو حمل نبضي، أما الاستنتاج الطويل فهو حمل مستمر كامل. نفس البطاقة، استهلاك الطاقة الفعلي لمهمة طويلة هو 3-5 أضعاف الاستنتاج القصير.
استهلاك الطاقة في الخزانة يتراوح من 36 كيلوواط إلى 200 كيلوواط، التبريد الهوائي لا يكفي، والتبريد بالسائل أصبح "اختياريًا" إلى "ضروري".
🔌 المبدل
عرض النطاق الترددي لمجموعة الاستنتاجات يتزايد من 100 جيجابت إلى 400 جيجابت، مئات الآلاف من البطاقات تتطلب جدولة. تستفيد كل من شبكات IB والإيثرنت عالية السرعة.
📦 لوحة ABF
توسعة العنقود من ألف بطاقة إلى عشرة آلاف بطاقة، كل شريحة تحتاج إلى تغليف. شركة ميزووتو تسيطر على أكثر من 90% من غشاء ABF، والفجوة في 2028 تصل إلى 42%.
ارتفاع أسعار الدقيق، والخبز سيكون أغلى فقط.
🧪 CCL M9
اللوحات الأم واللوحات الخلفية لمجموعات الاستنتاجات تتطلب مواد أساسية عالية السرعة. سعر M9 هو عشرة أضعاف الـ FR4 العادي، سوق AI CCL في 2027 يقدر بـ 18.7 مليار دولار، بمعدل نمو يتجاوز وحدات الضوء.
OpenClaw أشعل النار، وGLM-5.2 زودها بالحطب.
الأول جعل شركات النماذج تربح أول عوائد من الرموز، والثاني جعل هذا السوق يتجه من المختبر إلى الصناعة.
العمليات البسيطة لا تزال قائمة على التخزين، وتقف في الضوء، وتستمتع بفقاعة الذكاء الاصطناعي.
$MU $SKHYNIX $LITE
TOKEN%3.06
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت