العقود الآجلة
وصول إلى مئات العقود الدائمة
CFD
الذهب
منصّة واحدة للأصول التقليدية العالمية
الخیارات المتاحة
Hot
تداول خيارات الفانيلا على الطريقة الأوروبية
الحساب الموحد
زيادة كفاءة رأس المال إلى أقصى حد
التداول التجريبي
مقدمة حول تداول العقود الآجلة
استعد لتداول العقود الآجلة
أحداث مستقبلية
"انضم إلى الفعاليات لكسب المكافآت "
التداول التجريبي
استخدم الأموال الافتراضية لتجربة التداول بدون مخاطر
إطلاق
CandyDrop
اجمع الحلوى لتحصل على توزيعات مجانية.
منصة الإطلاق
-التخزين السريع، واربح رموزًا مميزة جديدة محتملة!
HODLer Airdrop
احتفظ بـ GT واحصل على توزيعات مجانية ضخمة مجانًا
Pre-IPOs
افتح الوصول الكامل إلى الاكتتابات العامة للأسهم العالمية
نقاط Alpha
تداول الأصول على السلسلة واكسب التوزيعات المجانية
نقاط العقود الآجلة
اكسب نقاط العقود الآجلة وطالب بمكافآت التوزيع المجاني
عروض ترويجية
AI
Gate AI
شريكك الذكي الشامل في الذكاء الاصطناعي
Gate AI Bot
استخدم Gate AI مباشرة في تطبيقك الاجتماعي
GateClaw
Gate الأزرق، جاهز للاستخدام
Gate for AI Agent
البنية التحتية للذكاء الاصطناعي، Gate MCP، Skills و CLI
Gate Skills Hub
أكثر من 10 آلاف مهارة
من المكتب إلى التداول، مكتبة المهارات الشاملة تجعل الذكاء الاصطناعي أكثر فعالية
GateRouter
ختر بذكاء من أكثر من 40 نموذج ذكاء اصطناعي، بدون أي رسوم إضافية 0%
تسريع التدريب المسبق بمقدار 2 إلى 3 أضعاف، خطة Nous الجديدة TST تقع في جدل "تصادم"
أخبار ME، في 14 مايو (بتوقيت UTC+8)، وفقًا لمراقبة 动察 Beating، أصدرت شركة Nous Research خطة تدريب جديدة لنموذج كبير تُسمى تراكب الكلمات (TST). تتيح هذه الخطة تقليل وقت التدريب بمقدار 2 إلى 3 مرات لنفس كمية الحسابات من خلال حزم وضغط الكلمات المجاورة قبل التدريب. يتكون TST من مرحلتين. في 20% إلى 40% الأولى من التدريب، لا يقرأ النموذج الكلمات بشكل فردي، بل يدمج الكلمات المجاورة ويأخذ متوسطها كمدخل، ويتوقع في النهاية الكلمات التي ستحتوي عليها الحزمة التالية (دون اعتبار الترتيب الداخلي). بعد ذلك، يعود النموذج إلى التوقع التقليدي للكلمة التالية. نظرًا لعدم تعديل الهيكل الأساسي، فإن النموذج الناتج يكون مطابقًا تمامًا للنموذج العادي أثناء الاستدلال. تم التحقق من صحة هذه الطريقة على نموذج MoE بأقصى 100 مليار معلمة. جوهر هذه الخطة هو “استخدام البيانات مقابل القوة الحسابية”، حيث يتم تقليل وقت الحساب من خلال استهلاك أسرع للبيانات. إذا نفدت النصوص عالية الجودة في المستقبل، فقد تصبح خاصية تسريع استهلاك البيانات نقطة ضعف. بالإضافة إلى ذلك، بعد ساعات من نشر الورقة، أشار بعض القراء إلى أن آلية TST تشبه بشكل كبير العمل السابق “Beyond Next Token Prediction” الذي نُشر في 2024. ثم اعترف فريق المؤلفين في Hugging Face بأن هذا هو “تطابق غير محظوظ في البحث (convergent research)”، ووعدوا بتحديث الورقة لإضافة الإشارة إليه. (المصدر: BlockBeats)