العقود الآجلة
وصول إلى مئات العقود الدائمة
TradFi
الذهب
منصّة واحدة للأصول التقليدية العالمية
الخیارات المتاحة
Hot
تداول خيارات الفانيلا على الطريقة الأوروبية
الحساب الموحد
زيادة كفاءة رأس المال إلى أقصى حد
التداول التجريبي
مقدمة حول تداول العقود الآجلة
استعد لتداول العقود الآجلة
أحداث مستقبلية
"انضم إلى الفعاليات لكسب المكافآت "
التداول التجريبي
استخدم الأموال الافتراضية لتجربة التداول بدون مخاطر
إطلاق
CandyDrop
اجمع الحلوى لتحصل على توزيعات مجانية.
منصة الإطلاق
-التخزين السريع، واربح رموزًا مميزة جديدة محتملة!
HODLer Airdrop
احتفظ بـ GT واحصل على توزيعات مجانية ضخمة مجانًا
Pre-IPOs
افتح الوصول الكامل إلى الاكتتابات العامة للأسهم العالمية
نقاط Alpha
تداول الأصول على السلسلة واكسب التوزيعات المجانية
نقاط العقود الآجلة
اكسب نقاط العقود الآجلة وطالب بمكافآت التوزيع المجاني
عروض ترويجية
AI
Gate AI
شريكك الذكي الشامل في الذكاء الاصطناعي
Gate AI Bot
استخدم Gate AI مباشرة في تطبيقك الاجتماعي
GateClaw
Gate الأزرق، جاهز للاستخدام
Gate for AI Agent
البنية التحتية للذكاء الاصطناعي، Gate MCP، Skills و CLI
Gate Skills Hub
أكثر من 10 آلاف مهارة
من المكتب إلى التداول، مكتبة المهارات الشاملة تجعل الذكاء الاصطناعي أكثر فعالية
GateRouter
ختر بذكاء من أكثر من 30 نموذج ذكاء اصطناعي، بدون أي رسوم إضافية 0%
باحث في DeepMind يعتقد أن سبب تأجيل DeepSeek V4 هو أن مضاعفة بيانات التدريب إلى 33 تيرابايت أدت إلى عدم استقرار شديد
وفقًا لمراقبة Beating، كشف تقرير تقنية DeepSeek V4 أن V4-Flash و V4-Pro تم تدريبهما مسبقًا على 32 تريليون و 33 تريليون وحدة رمزية على التوالي، وهو ضعف تقريبًا عن 15 تريليون وحدة رمزية في V3. يعترف التقرير بأن عملية التدريب واجهت “تحديات عدم استقرار ملحوظة”، حيث تكررت ارتفاعات مفاجئة في خسارة التدريب، ويعود السبب إلى قيم شاذة في طبقة MoE، كما أن آلية التوجيه نفسها تزيد من تفاقم هذه القيم الشاذة، ولا يمكن ح rollback بسيط القضاء عليها بشكل كامل.
وجدت DeepSeek حلين وتم تطبيقهما في التدريب الفعلي: التوجيه التنبئي (Anticipatory Routing)، الذي يفصل حساب مؤشر التوجيه عن تحديث الشبكة الأساسية، ويُشغل تلقائيًا فقط عند اكتشاف ارتفاع في الخسارة، مع تكلفة إضافية حوالي 20٪؛ وتثبيت SwiGLU (SwiGLU Clamping)، الذي يقيد قيم التنشيط ضمن نطاق ثابت لوقف القيم الشاذة مباشرة. يذكر التقرير أن كلا الحلين فعالان، لكنه يعترف بأن “المبادئ الأساسية لم تُفهم بشكل كامل بعد”.
علق الباحث في DeepMind جوجل، سوزان تشانغ (التي عملت سابقًا في Meta AI و OpenAI)، قائلة إن عدم الاستقرار الناتج عن مضاعفة بيانات التدريب “يفسر التأجيل”، ووصف هذين الحلين بـ “لاصق الجروح”، مع إبداء إعجابها بشفافية تقنية DeepSeek.