تم الكشف عن مذكرة داخلية لشركة Tencent: النموذج الأحدث Hy3 يستخدم رمز Claude في مرحلة ما بعد التدريب

وفقًا لمراقبة دونتشا بيتينغ، ذكرت المصادر المطلعة من شركة تينسنت أن المعلومات استشهدت بمذكرة داخلية من تينسنت تكشف أن موظفي تينسنت استخدموا كود كلود من أنثروبيك خلال مرحلة ما بعد التدريب لتطوير نموذج Hy3، على الرغم من أن أنثروبيك حظرت صراحة الخدمات التجارية للشركات الصينية لأسباب أمنية وطنية. يُعد Hy3 أقوى نموذج لغة كبير حتى الآن من تينسنت، ويتميز بمعمارية MoE تحتوي على 295 مليار معلمة، وتم تطويره تحت قيادة كبير علماء الذكاء الاصطناعي ياو شونيو، الذي انضم إلى تينسنت في نهاية العام الماضي. خلال مرحلة RLHF (التعلم المعزز من التغذية الراجعة البشرية)، نظمت تينسنت موظفين ليعملوا كمقيمين بشريين، ووفرت المذكرة الداخلية إرشادات تثبيت لكود كلود، مع حد استخدام “آلاف الرموز” لكل شخص. لم يعتبر موظفو تينسنت ذلك تقطيرًا (تدريب نموذج أضعف باستخدام مخرجات نموذج أقوى). نهجهم كان يتضمن طرح نفس الأسئلة البرمجية على نموذجين مجهولين وإجراء تقييمات عمياء؛ وفي الوقت نفسه، استخدموا كود كلود لتوليد أمثلة سلوكية عالية الجودة في الوقت الحقيقي كمرجع للمساعدة في تصفية الردود منخفضة الجودة. أكد موظفو عدة شركات ذكاء اصطناعي أن استخدام النماذج الرائدة في الصناعة كمراجع معيارية أثناء مرحلة ما بعد التدريب هو ممارسة شائعة. وذكر متحدث باسم أنثروبيك أن فريق الأمان في الشركة “يراقب بنشاط هجمات التقطير ويتخذ إجراءات فورية عند الاكتشاف”، لكنه لم يعالج مباشرة استخدام تينسنت لكود كلود. الطريقة الشائعة للشركات والمطورين الصينيين للوصول إلى كود كلود هي من خلال وسطاء أو عن طريق التسجيل بأرقام هواتف أو بطاقات ائتمان غير صينية. في وقت سابق من هذا الشهر، شددت أنثروبيك متطلبات التحقق الخاصة بها، حيث يحتاج بعض المستخدمين إلى تقديم صور هوية صادرة عن الحكومة وصور شخصية.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت