فنيون OpenAI ينتقدون توصيات أجهزة V4: تحول مفاجئ عن تأثير V3 في الصناعة

robot
إنشاء الملخص قيد التقدم

وفقًا للمراقبة التي أجرتها Beating، صرح فني OpenAI كلايف تشان أن التقرير الفني العام لـ V4 لا يزال ممتازًا، لكن التوصيات الخاصة بالأجهزة لمصنعي الرقائق تعتبر “مخيبة للآمال بشكل مفاجئ وحتى خاطئة”، وتتناقض بشكل حاد مع V3. تضمن قسم الأجهزة في تقرير V3 حوار أسئلة وأجوبة كان الأكثر شعبية في المؤتمر الأكاديمي ISCA، مع توصيات كانت محددة لمعايير الصناعة التي كانت قيد التطوير للوصلات، في حين أن V4 أصبح أكثر غموضًا بكثير. أثار تشان عدة نقاط خلاف. فيما يتعلق باستهلاك الطاقة، يدعي التقرير أن تحسين البرمجيات يسمح للرقائق بتشغيل الحساب والتخزين والاتصال بكامل طاقتها في وقت واحد، مما يشير إلى أن مصنعي الرقائق يحتفظون بمزيد من مساحة الطاقة الاحتياطية. يجادل تشان بأن هذا “غير فعال”: استهلاك الطاقة الإجمالي للرقاقة محدود بالعمليات الفيزيائية، واحتفاظها بمزيد من مساحة الطاقة الاحتياطية يعني خفض تردد التشغيل، وبالتالي تقليل القدرة الحسابية. في موضوع نقل البيانات بين وحدات معالجة الرسومات، يقترح التقرير أن تتلقى وحدات معالجة الرسومات البيانات بشكل نشط (السحب) بدلاً من أن يتم دفعها إليهم، بسبب الحمل الزائد العالي لإشعارات الدفع. يشكك تشان في هذا الحكم، معتقدًا أن السحب في الواقع أبطأ وأن قدرات معالجة البيانات في بطاقات الشبكة يجب تحسينها. ومع ذلك، قد لا يكون الاثنان يناقشان نفس مستوى القضايا: يتناول التقرير عبء آلية الإشعار، بينما يركز تشان على زمن الانتقال نفسه. فيما يتعلق بوظائف التنشيط، يوصي التقرير باستبدال SwiGLU بوظائف أبسط لتقليل العبء الحسابي، لكن يعتقد تشان أن ذلك غير ضروري، حيث أظهر Sonic MoE أن الأداء الأمثل يمكن تحقيقه باستخدام SwiGLU. يشتبه تشان في أن DeepSeek قد “قللت عمدًا من أهمية هذا القسم”.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت