مُهندسو OpenAI يطرحون أسئلة على كل نقطة بشأن اقتراحات الأجهزة لـ V4: الفصل الذي أذهل الصناعة في V3 هذه المرة "مفاجئ"

وفقًا لمراقبة Beating، قال فريق تقنية OpenAI Clive Chan إن التقرير التقني V4 لا يزال على مستوى رفيع، لكن الفصل الخاص بالنصائح لموردي الشرائح hardware كان “مفاجئًا جدًا ومملًا حتى أنه يحتوي على أخطاء”، مما يشكل تباينًا مع V3. كان قسم الأسئلة والأجوبة في فصل hardware الخاص بـ V3 من أكثر النقاشات حيوية في مؤتمر ISCA، حيث كانت النصائح تتعلق بمعايير الاتصال التي يتم وضعها حاليًا في الصناعة، بينما أصبح V4 أكثر عمومية بكثير.

طرح Chan الشكوك واحدة تلو الأخرى. بخصوص استهلاك الطاقة، ذكر التقرير أن تحسينات البرمجيات تجعل الشرائح تعمل بكامل طاقتها في الحساب والتخزين والاتصال في آن واحد، ونصحت الشركات المصنعة بترك مساحة أكبر للطاقة. اعتبر Chan أن ذلك “عكس المتوقع تمامًا”: فالاستهلاك الكلي للطاقة للشرائح محدود بواسطة العمليات الفيزيائية، وترك مساحة أكبر للطاقة يعني تقليل تردد التشغيل، وبالتالي تقليل القدرة الحسابية. بخصوص طريقة نقل البيانات بين وحدات معالجة الرسوميات، ذكر التقرير أن الاختيار هو جعل الـ GPU يقرأ البيانات بشكل نشط (pull)، بدلاً من دفع البيانات إليها (push)، لأن إشعار الدفع (push) يتطلب تكلفة عالية. شكك Chan في هذا الحكم، معتبرًا أن الـ pull أبطأ في الواقع، ويجب تحسين قدرة بطاقة الشبكة على معالجة البيانات. ومع ذلك، قد لا يكون النقاش بينهما حول نفس المستوى: التقرير يتحدث عن تكلفة آلية الإشعار، بينما يتحدث Chan عن تأخير النقل نفسه. بخصوص وظيفة التنشيط، اقترح التقرير استبدالها بدالة أبسط لتقليل عبء الحساب، لكن Chan رأى أن ذلك غير ضروري، لأن Sonic MoE أثبت أن استخدام SwiGLU يمكن أن يصل إلى الأداء الأمثل. شكك Chan في أن DeepSeek “تقصد تقليل أهمية هذا الفصل عمدًا”.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت