المهندس السابق في ByteDance Seed: دورة التكرار في ByteDance تستغرق نصف عام، بينما يقال أن Google تحتاج فقط إلى ثلاثة أشهر.

robot
إنشاء الملخص قيد التقدم
ME News رسالة، في 24 أبريل (UTC+8)، وفقًا لرصد Beating، كشف تشانغ تشي، المهندس السابق في فريق Seed لشركة ByteDance والأستاذ المساعد الحالي في جامعة بكين، في البودكاست "Into Asia" أن ByteDance تحتاج حوالي ستة أشهر لإكمال جولة تدريب نموذج كبير (التدريب المسبق والتدريب اللاحق)، بينما جوجل حسب الشائعات تحتاج ثلاثة أشهر فقط. يعتقد أن سرعة التكرار هي أحد الأسباب الجوهرية التي تجعل الشركات الصينية تواجه صعوبة في اللحاق بالركب. أمضى تشانغ تشي حوالي عام في ByteDance، وكان فريقه الرياضي ذا طابع بحثي، ووصف أن定位 مجموعته "أكثر من أجل الدعاية"، على عكس فرق التدريب المسبق واللاحق المسؤولة عن تسليم النماذج. وصف تشانغ تشي ثقافة benchmaxxing (رفع الدرجات) داخل Seed: يقيم قادة الفرق الأداء بناءً على المعايير المرجعية، والجميع يركض وراء الدرجات، "لكن هذا لا يترجم إلى تجربة جيدة في الاستخدام الفعلي". قال إن نماذج الشركات الكبيرة الصينية على الورق تلحق بالنماذج الأمريكية المتطورة، لكن عند الاستخدام الفعلي "ليست جيدة بما يكفي". هدف Seed هو أن تكون الأفضل عالميًا، "لكن للأسف، لا أعتقد أننا لحقنا بهم"، حتى هدف أن نكون الأول محليًا "لم يتحقق". في نهاية 2024، اعتبر Seed نفسه قد لحق بـ GPT-4o، ثم تم إطلاق DeepSeek، وأدرك الفريق أن الفجوة لا تزال قائمة، وعند انضمامه كان الفريق بأكمله يتحول بشكل عاجل إلى التعلم المعزز. (المصدر: BlockBeats)
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت