العقود الآجلة
وصول إلى مئات العقود الدائمة
TradFi
الذهب
منصّة واحدة للأصول التقليدية العالمية
الخیارات المتاحة
Hot
تداول خيارات الفانيلا على الطريقة الأوروبية
الحساب الموحد
زيادة كفاءة رأس المال إلى أقصى حد
التداول التجريبي
مقدمة حول تداول العقود الآجلة
استعد لتداول العقود الآجلة
أحداث مستقبلية
"انضم إلى الفعاليات لكسب المكافآت "
التداول التجريبي
استخدم الأموال الافتراضية لتجربة التداول بدون مخاطر
إطلاق
CandyDrop
اجمع الحلوى لتحصل على توزيعات مجانية.
منصة الإطلاق
-التخزين السريع، واربح رموزًا مميزة جديدة محتملة!
HODLer Airdrop
احتفظ بـ GT واحصل على توزيعات مجانية ضخمة مجانًا
Pre-IPOs
افتح الوصول الكامل إلى الاكتتابات العامة للأسهم العالمية
نقاط Alpha
تداول الأصول على السلسلة واكسب التوزيعات المجانية
نقاط العقود الآجلة
اكسب نقاط العقود الآجلة وطالب بمكافآت التوزيع المجاني
أطلقت جوجل الدليل التدريبي للمطورين للجيل السابع من وحدة معالجة Tensor Ironwood، مع شرح مفصل لتحسين الأداء على مستوى النظام
أخبار ME News، في 2 أبريل (بتوقيت UTC+8)، أصدرت جوجل مؤخرًا دليل تدريب للمطورين يستهدف معالج Ironwood TPU من الجيل السابع. يهدف هذا الدليل إلى مساعدة المطورين على الاستفادة الكاملة من الأداء على مستوى النظام لـ Ironwood TPU، من أجل تدريب ونشر نماذج الذكاء الاصطناعي المتقدمة بكفاءة. يُعد Ironwood TPU بنية أساسية مخصصة للذكاء الاصطناعي مصممة لتلبية متطلبات حسابات نماذج ذات تريليونات المعاملات، حيث يستخدم تقنيات مثل الربط بين الشرائح (ICI)، والمبدّل الضوئي لمسارات الإرسال (OCS)، وشبكة مراكز البيانات (DCN)، وذاكرة عالية النطاق الترددي مجمّعة (HBM) لبناء نظام كامل يدعم ما يصل إلى 9,216 شريحة. يشرح المقال بالتفصيل عدة استراتيجيات تحسين رئيسية لهذا العتاد، بما في ذلك: استخدام وحدة الضرب المصفوفي (MXU) التي تدعم تدريب FP8 بشكل أصلي لزيادة الإنتاجية؛ واعتماد مكتبة نوى JAX المخصصة للـ TPU Tokamax، من خلال “الانتباه المتطاير” و"Megablox تجميع الضرب المصفوفي ضمن مجموعات" للتعامل مع التلافيف غير المنتظمة في نماذج السياقات الطويلة ونماذج الخبراء المختلطة؛ واستغلال النواة المتفرعة من الجيل الرابع (SparseCore) لتفريغ عمليات الاتصالات الجماعية وإخفاء التأخير؛ وضبط توزيع ذاكرة SRAM السريعة على الشريحة الخاصة بـ TPU (VMEM) بدقة لتقليل تعطل الذاكرة؛ وكذلك اختيار أفضل استراتيجية للتقسيم وفقًا لحجم النموذج والبنية وطول التسلسل (مثل FSDP وTP وEP). (المصدر: InFoQ)