العقود الآجلة
وصول إلى مئات العقود الدائمة
TradFi
الذهب
منصّة واحدة للأصول التقليدية العالمية
الخیارات المتاحة
Hot
تداول خيارات الفانيلا على الطريقة الأوروبية
الحساب الموحد
زيادة كفاءة رأس المال إلى أقصى حد
التداول التجريبي
مقدمة حول تداول العقود الآجلة
استعد لتداول العقود الآجلة
أحداث مستقبلية
"انضم إلى الفعاليات لكسب المكافآت "
التداول التجريبي
استخدم الأموال الافتراضية لتجربة التداول بدون مخاطر
إطلاق
CandyDrop
اجمع الحلوى لتحصل على توزيعات مجانية.
منصة الإطلاق
-التخزين السريع، واربح رموزًا مميزة جديدة محتملة!
HODLer Airdrop
احتفظ بـ GT واحصل على توزيعات مجانية ضخمة مجانًا
Pre-IPOs
افتح الوصول الكامل إلى الاكتتابات العامة للأسهم العالمية
نقاط Alpha
تداول الأصول على السلسلة واكسب التوزيعات المجانية
نقاط العقود الآجلة
اكسب نقاط العقود الآجلة وطالب بمكافآت التوزيع المجاني
PyTorch TorchInductor يدمج CuteDSL كخلفية لضبط أداء ضرب المصفوفات تلقائيًا
أخبار ME News، في 7 أبريل (بتوقيت UTC+8)، أعلن فريق PyTorch الرسمي مؤخرًا أنه قد دمج CuteDSL كخلفية تلقائية لضبط أداء ضرب المصفوفات في TorchInductor، كالرابع من نوعها. تم اختيار هذه الخلفية استنادًا إلى ثلاثة معايير: عدم زيادة عبء الصيانة بشكل كبير، وعدم إبطاء وقت الترجمة أو الاختبار المعياري، وتقديم أداء أفضل على عبء العمل المستهدف. تم تطوير CuteDSL بشكل نشط بواسطة NVIDIA، ويقدم قوالب نواة محسنة، ويتميز بزمن ترجمة مماثل للخلفيات الحالية، ويتفوق بشكل ملحوظ على مسار CUTLASS C++ الذي يتطلب ترجمة كاملة باستخدام nvcc. تعتمد هذه الخلفية على نفس التجريد المستخدم في CUTLASS C++، مكتوبة بلغة بايثون، وتترجم بشكل أسرع وأسهل في الصيانة، وقد أثبتت قدرتها على تقديم أداء قوي في دمج FP8 GEMM و Epilogue. يركز الفريق على تحسين GEMM (ضرب المصفوفات)، لأنه يشكل الجزء الرئيسي من الحساب في نماذج Transformer. يوفر CuteDSL قوالب محسنة يدويًا لتوليد الكود الأساسي، مما يتجنب تعقيد كتابة النواة من الصفر، ويكشف تمامًا عن بنية الخيوط والذاكرة، ويدعم الميزات الخاصة بالمعمارية. (المصدر: InFoQ)