العقود الآجلة
وصول إلى مئات العقود الدائمة
TradFi
الذهب
منصّة واحدة للأصول التقليدية العالمية
الخیارات المتاحة
Hot
تداول خيارات الفانيلا على الطريقة الأوروبية
الحساب الموحد
زيادة كفاءة رأس المال إلى أقصى حد
التداول التجريبي
مقدمة حول تداول العقود الآجلة
استعد لتداول العقود الآجلة
أحداث مستقبلية
"انضم إلى الفعاليات لكسب المكافآت "
التداول التجريبي
استخدم الأموال الافتراضية لتجربة التداول بدون مخاطر
إطلاق
CandyDrop
اجمع الحلوى لتحصل على توزيعات مجانية.
منصة الإطلاق
-التخزين السريع، واربح رموزًا مميزة جديدة محتملة!
HODLer Airdrop
احتفظ بـ GT واحصل على توزيعات مجانية ضخمة مجانًا
Pre-IPOs
افتح الوصول الكامل إلى الاكتتابات العامة للأسهم العالمية
نقاط Alpha
تداول الأصول على السلسلة واكسب التوزيعات المجانية
نقاط العقود الآجلة
اكسب نقاط العقود الآجلة وطالب بمكافآت التوزيع المجاني
GLM-5.1 جعل النموذج المفتوح المصدر يثبت أقدامه لأول مرة في مهام المشاريع طويلة الأمد
بدأ النموذج المفتوح المصدر يأخذ الأمور على محمل الجد في المهام طويلة المدى
أعلن OpenRouter عن دمج GLM-5.1، مما حول النقاش من “ما حجم المعاملات” إلى “كم يمكن أن يستمر في العمل بشكل متواصل”. خلال غياب المراقبة، قام GLM-5.1 بتحسين قاعدة بيانات المتجهات لمدة 8 ساعات، وأجرى أكثر من 600 تكرار، مع زيادة الأداء بمقدار 6 أضعاف. هذا غير موقع النماذج المفتوحة المصدر: لم تعد مجرد بديل رخيص، بل ربما تكون أكثر فاعلية في سير العمل الهندسي — خاصة أن نماذج مغلقة مثل Claude Opus 4.6 غالبًا ما تتوقف عن التحسن بعد تجربة بسيطة. ساعد كبار مسؤولي Hugging Face في الترويج، لكن التغريدات لم تذكر غالبًا تكلفة الحوسبة.
ردود الفعل لا تزال كما هي، مع انقسام حاد:
نقاط مهمة يجب ملاحظتها:
الفرق بين نتائج الاختبار والتنفيذ الفعلي
أثارت عبارة “نسبة إكمال المهام طويلة المدى” جدلاً. عرض Z.ai (مثل إعداد سطح مكتب Linux الخاص بهم) ونتائج GLM-5.1 في Terminal-Bench 2.0 بنسبة 63.5% (بعد التحسين 69%) لا تتطابق. هناك فجوة بين التسويق والاختبار الحقيقي: الترويج يحتاج إلى إثارة، لكن الشركات تريد حالات يمكن التحقق منها، مثل تكامل روبوت الإشارة من Bella Protocol. استخدمت VentureBeat وComputerworld مصطلح “يوم عمل 8 ساعات” لرفع توقعات المستثمرين. حجم المعاملات أصبح أقل أهمية أمام “القدرة على الإنتاج المستمر” — وGLM-5.1 استسلمت لهذا، لكن تكاليف التشغيل أعلى أيضًا.
هذه المسيرة—from التغريدات إلى إعادة التغريد من الخبراء ثم متابعة وسائل الإعلام—تجبر المختبرات المغلقة على تفسير سبب ارتفاع التكاليف. قد تروج Anthropic لـ"نسخة أسرع" (مثل Claude Opus 4.6 Fast) لمواجهة ذلك. السوق معتاد على مراقبة SOTA، لكنه يقلل من شأن الانقسامات المحتملة بسبب العوامل الجيوسياسية. GLM-5.1 يُختبر الآن لمعرفة مدى قدرة استراتيجية الذكاء الاصطناعي الصينية على التوسع عالميًا.
الاستنتاج: أن GLM-5.1 حولت “القدرة على التشغيل المستمر لعدة ساعات” إلى معيار أساسي في المهام الهندسية، وبدأت النماذج المفتوحة تصبح الخيار الافتراضي في سير العمل المحدد. الفرق الآن هو أن الفرق التي تركز على تحسين الكفاءة والتحقق من الهياكل المختلطة ستكون أكثر ميزة في المرحلة القادمة.
الأهمية: عالية
التصنيف: إصدار النماذج، اتجاهات الصناعة، المصدر المفتوح
الحكم: بالنسبة للمطورين الذين يبنون ويضبطون النماذج بأنفسهم، ولصناديق التمويل التي تعمل على البنية التحتية، هذه فرصة مبكرة للاستفادة. أما من يركز فقط على قدرات الحوار العامة، فالعلاقة ليست قوية. الفرق التي لا تبدأ الآن في تجارب المهام طويلة المدى وتحسينات تقديم الخدمات ستتخلف عن الركب في المرحلة التالية من تطبيقات الشركات.