العقود الآجلة
وصول إلى مئات العقود الدائمة
CFD
الذهب
منصّة واحدة للأصول التقليدية العالمية
الخیارات المتاحة
Hot
تداول خيارات الفانيلا على الطريقة الأوروبية
الحساب الموحد
زيادة كفاءة رأس المال إلى أقصى حد
التداول التجريبي
مقدمة حول تداول العقود الآجلة
استعد لتداول العقود الآجلة
أحداث مستقبلية
"انضم إلى الفعاليات لكسب المكافآت "
التداول التجريبي
استخدم الأموال الافتراضية لتجربة التداول بدون مخاطر
إطلاق
CandyDrop
اجمع الحلوى لتحصل على توزيعات مجانية.
منصة الإطلاق
-التخزين السريع، واربح رموزًا مميزة جديدة محتملة!
HODLer Airdrop
احتفظ بـ GT واحصل على توزيعات مجانية ضخمة مجانًا
Pre-IPOs
افتح الوصول الكامل إلى الاكتتابات العامة للأسهم العالمية
نقاط Alpha
تداول الأصول على السلسلة واكسب التوزيعات المجانية
نقاط العقود الآجلة
اكسب نقاط العقود الآجلة وطالب بمكافآت التوزيع المجاني
عروض ترويجية
AI
Gate AI
شريكك الذكي الشامل في الذكاء الاصطناعي
Gate AI Bot
استخدم Gate AI مباشرة في تطبيقك الاجتماعي
GateClaw
Gate الأزرق، جاهز للاستخدام
Gate for AI Agent
البنية التحتية للذكاء الاصطناعي، Gate MCP، Skills و CLI
Gate Skills Hub
أكثر من 10 آلاف مهارة
من المكتب إلى التداول، مكتبة المهارات الشاملة تجعل الذكاء الاصطناعي أكثر فعالية
GateRouter
ختر بذكاء من أكثر من 40 نموذج ذكاء اصطناعي، بدون أي رسوم إضافية 0%
تعاونت هواوي مع جامعة الصين للعلوم والتكنولوجيا لكسر احتكار نيفيديا، وسرعة حسابات خبراء النماذج الكبيرة على سونغتينغ A3 تتسارع بنسبة 58%
وفقًا لمراقبة Beating، في تطور بنية MoE واسعة النطاق، أصبح استخدام شرائح Ascend المحلية لتدريب النماذج الكبيرة اتجاهًا رئيسيًا لبناء قدرات ذكاء اصطناعي مستقلة وقابلة للتحكم. ومع ذلك، فإن معظم أُطُر النماذج الكبيرة السائدة تعتمد على بيئة CUDA من إنفيديا، وعند نقلها مباشرة إلى منصة Ascend، تواجه تحديات مثل عدم توازن جدولة قوائم الأجهزة وانخفاض كفاءة استخدام القدرة الحسابية. أطلقت جامعة العلوم والتكنولوجيا، وهواوي، وجامعة بكين إطار عمل للترجمة والجدولة يسمى HyperParallel-MoE، والذي يستهدف إدارة قوائم الأجهزة الفريدة في A3 من Ascend على مستوى البلاط (tile-level)، بهدف كسر عنق الزجاجة في كفاءة الطاقة عند الجدولة المتوازية للحوسبة غير المتجانسة.
يحتوي A3 من Ascend على نوعين من النوى، AIC المسؤول عن ضرب المصفوفات، وAIV الذي يتعامل مع حسابات المتجهات والاتصالات. ولكن في ظل الجدولة التسلسلية التقليدية للعمليات، يمكن لنوعين من النوى العمل بالتناوب، مما يؤدي إلى فترات فراغ متبادلة. أظهرت البيانات التجريبية أنه عند تشغيل نموذج كبير بأسلوب DeepSeek بحجم 671 مليار على مجموعة من 256 عقدة، كانت نسبة استخدام AIC فقط 67%، و39% من تأخيرات توجيه الخبراء عبر الشبكة ظهرت على مسار الحساب الحرج.
تتضمن التعديلات الأساسية في HyperParallel-MoE ثلاث نقاط. الأولى، تصميم أمر كتابة أحادي الجانب يقوده AIV، بحيث يتم تفعيل الحساب فور وصول بيانات البلاط، دون الحاجة لانتظار اكتمال الدفعة كاملة. الثانية، إدخال توليد مهام البلاط المعتمدة على الاعتمادية، حيث يتم تجريد الاتصالات والعمليات الحسابية بشكل موحد. الثالثة، استخدام مُجدول ثابت مسبقًا لتوليد تسلسل المهام، بحيث يقود نواتان من نوعين من النوى بشكل متزامن داخل نواة واحدة، ويستفيد من ذاكرة L2 عالية السرعة لمشاركة النتائج الوسيطة، مما يقلل من زمن التأخير الناتج عن الكتابة والقراءة من ذاكرة HBM البطيئة.
أظهرت الاختبارات أنه تحت توجيه متوازن عبر 64 عقدة، تقلصت مدة تأخير الوحدة الأساسية المسؤولة عن حساب الخبراء (MoE-FFN) بحوالي 36%، مما يعادل زيادة سرعة معالجة البيانات بنسبة تصل إلى 58% (أي تحسين من 1.49 إلى 1.58 مرة في السرعة). وفي التشغيل الشامل من طرف إلى طرف، زادت سرعة التدريب خطوة واحدة بنسبة تتراوح بين 8% و9%. هذا يوضح أن الكفاءة الفعلية لشرائح Ascend لا تعتمد فقط على المواصفات المادية، بل تعتمد أيضًا على قدرة المترجم وبيئة التشغيل على جدولة نوى AIC/AIV بكفاءة عالية.
والجامعة الصينية في الهندسة المعمارية،
وهواوي تنفذ على أرض الواقع،
نموذج الإنتاج والتعلم والبحث هو الأنسب.