بحثا جديدا أصدرته DeepSeek مؤخرا جذب انتباه مجتمع التكنولوجيا. اقترحوا بنية جديدة تسمى الاتصال الفائق المقيد بمانيفولد (mHC)، والهدف الأساسي في الواقع واضح - حل نقطتي ألم في تقنية شبكة الاتصال الفائق الحالية: عدم استقرار التدريب وقابلية التوسع المحدودة.

جذر هذه المشكلة هو أن تقنية HC تدمر خصائص رسم الهوية. حل DeepSeek هو تحويل فضاء الاتصال المتبقي ل HC إلى متعدد أبعاد محدد، مما يعيد خصائص تعيين الهوية. قد يبدو الأمر مجرد بعض الشيء، لكن بصراحة، هو لجعل التدريب العميق على الشبكات أكثر استقرارا وقابلية للتوسع من خلال رسم خرائط رياضية أذكى.

تتضمن الورقة أيضا تحسين البنية التحتية لضمان الكفاءة العملية، وتظهر النتائج التجريبية تحسنا كبيرا في الأداء وقابلية توسع متفوقة. وهذا يعني أنه مع هيكل شبكة أعمق، تصبح عملية التدريب أكثر قابلية للتحكم.

تؤمن DeepSeek بأن mHC هو امتداد مرن وعملي لتقنية HC، مما يمكن أن يساعد الصناعة على فهم تصميم البنية الطوبولوجية بشكل أفضل، بل يشير أيضا إلى اتجاه واعد جدا لتطور النماذج الكبيرة. أكمل هذا البحث شيه تشندا، وي ييشوان، تساو هوانتشي، ليانغ وينفنغ وآخرون.

على المدى الطويل، سيكون للاختراقات في مثل هذه البنية التحتية تأثير عميق على استقرار وقابلية التوسع للنماذج الكبيرة.

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

تسجيلات الإعجاب 23

أعجبني
23
7
إعادة النشر
مشاركة

تعليق

إضافة تعليق

لا توجد تعليقات

المواضيع الرائجة
عرض المزيد
#
gStocksTokenizedStocksLive
4.79M درجة الشعبية
#
StrongNonfarmPayrollsRekindleRateHikeFear
1.05M درجة الشعبية
#
IsraelStrikesIranBTCPlunges
68.22K درجة الشعبية
#
PredictWorldCupShare20000U
214.61K درجة الشعبية
#
ETHBreaks1700
152.62M درجة الشعبية

مُثبت

خريطة الموقع

ورقة بحثية جديدة من DeepSeek: كيف يحل الهيكل الفائق المرتبط بقيود المنحنى مشكلة تدريب الشبكات العميقة

المواضيع الرائجة

gStocksTokenizedStocksLive

StrongNonfarmPayrollsRekindleRateHikeFear

IsraelStrikesIranBTCPlunges

PredictWorldCupShare20000U

ETHBreaks1700

مُثبت