العقود الآجلة
وصول إلى مئات العقود الدائمة
TradFi
الذهب
منصّة واحدة للأصول التقليدية العالمية
الخیارات المتاحة
Hot
تداول خيارات الفانيلا على الطريقة الأوروبية
الحساب الموحد
زيادة كفاءة رأس المال إلى أقصى حد
التداول التجريبي
مقدمة حول تداول العقود الآجلة
استعد لتداول العقود الآجلة
أحداث مستقبلية
"انضم إلى الفعاليات لكسب المكافآت "
التداول التجريبي
استخدم الأموال الافتراضية لتجربة التداول بدون مخاطر
إطلاق
CandyDrop
اجمع الحلوى لتحصل على توزيعات مجانية.
منصة الإطلاق
-التخزين السريع، واربح رموزًا مميزة جديدة محتملة!
HODLer Airdrop
احتفظ بـ GT واحصل على توزيعات مجانية ضخمة مجانًا
منصة الإطلاق
كن من الأوائل في الانضمام إلى مشروع التوكن الكبير القادم
نقاط Alpha
تداول الأصول على السلسلة واكسب التوزيعات المجانية
نقاط العقود الآجلة
اكسب نقاط العقود الآجلة وطالب بمكافآت التوزيع المجاني
PyTorch TorchInductor دمج CuteDSL كخلفية لضبط الأداء التلقائي لضرب المصفوفات
أخبار ME، 7 أبريل (UTC+8)، أعلنت مؤخرًا مجموعة PyTorch الرسمية أن فريقها قام بدمج CuteDSL داخل TorchInductor بوصفه الجهة الرابعة من خلفيات ضبط أداء ضرب المصفوفات تلقائيًا. تم اختيار هذه الخلفية وفقًا لثلاثة معايير: عدم إضافة عبء صيانة كبير جدًا، وعدم إبطاء وقت الترجمة أو اختبارات القياس، وتقديم أداء أفضل على أحمال العمل المستهدفة. يتم تطوير CuteDSL بنشاط من قِبل NVIDIA، ويوفر قوالب نوى محسّنة. كما أن زمن ترجمته مماثل لزمن الخلفيات الحالية، لكنه يتفوق بشكل واضح على مسار CUTLASS C++ الذي يتطلب ترجمة كاملة باستخدام \nvcc\ . تعتمد هذه الخلفية على نفس التجريدات المستخدمة في CUTLASS C++، وهي مكتوبة بلغة Python؛ لذلك فهي أسرع في الترجمة وأسهل في الصيانة. وقد أثبتت أداءً قويًا في دمج FP8 GEMM وEpilogue. يركز الفريق على تحسين GEMM (ضرب المصفوفات)، نظرًا لأن هذا النوع يشكل معظم عبء الحساب في نماذج Transformer. يتيح CuteDSL توليد كود المستوى الأساسي عبر توفير قوالب محسّنة يدويًا، مما يتجنب تعقيد كتابة النوى من الصفر، كما يكشف بالكامل عن بنية الخيوط والهرمية الخاصة بالذاكرة، ويدعم ميزات خاصة بالمعمارية. (المصدر: InFoQ)