انفجار في NeurIPS! SentientAGI قامت بتطبيق "رمز مكافحة التزوير" للنموذج الكبير في القاعة الرئيسية، 24000 بصمة لحام للنموذج ولم تنقلب الأمور.
@SentientAGI 的 OML 1.0 مباشرة دخلت إلى مسار أوراق المؤتمر الرئيسي في NeurIPS - ليس مجرد ملصق للعرض، ولا ورشة عمل هامشية، بل هو المسار الرئيسي الصحيح! هذه الخطوة، رفعت تقنية "توسيم" النموذج الكبير إلى مستوى جديد.
ببساطة، ما قامت به ورقتهم البحثية "Scalable Fingerprinting for LLMs" هو لصق "وشم مضاد للتزوير غير مرئي" على النماذج الكبيرة، وليس مجرد واحد، بل عدة آلاف، ولا يمكن إزالته بأي شكل من الأشكال! كانت الحلول السابقة لبصمات النماذج تبدو وكأنها ملصقات رديئة: بعد إدخال بعض المفاتيح، تبدأ في "تغيير النكهة"، ويبدأ أداء النموذج في التدهور، وبدون أي جهد تختفي بعد غسلتين، واستخدام النماذج مفتوحة المصدر كان بمثابة كارثة. لكن OML 1.0 قامت بشيء جديد - باستخدام "Perinucleus Sampling (عينة عكسية للنواة)" لإدخال البصمة في "المنطقة الحدودية" للنموذج، دون التأثير على مخرجات النموذج، وفي نفس الوقت يمكنها الاحتفاظ بعشرات الآلاف من "رموز التحقق المستقرة"، إنه رائع!
الأكثر غرابة هو أنهم قاموا بإدخال 24576 بصمة على Llama-3.1-8B، ومع ذلك لم تتغير أداء النموذج تقريبًا! حتى لو قمت بإجراء SFT على النموذج، أو قمت بالتقطير، أو حتى خلطت عدة نماذج معًا "تزاوج"، تبقى هذه البصمات ثابتة كالجرو القديم، لا يمكن التخلص منها.
✅ تعرف على الحقيقة بمجرد التحقق، لن تخاف بعد الآن من "نموذج لي غوي" ✅ مخبأة بإحكام، وعند استخدامها لا تشعر بأي شيء على الإطلاق ✅ أداء بدون فقدان، النموذج كيف كان قويًا سيبقى قويًا ✅ تريد أن تدمج بقدر ما تريد، قم بالتوسع بشكل مباشر حتى النهاية
ما هذه الابتكارات التقنية؟ إنها ببساطة تفتح "طريق السماء" لتجارية النماذج مفتوحة المصدر - في المستقبل، من يملك النموذج، وما إذا تم التلاعب به، يمكن معرفة ذلك بنظرة واحدة على "الوشم الخفي"، إنه لطيف للغاية!
@SentientAGI
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
انفجار في NeurIPS! SentientAGI قامت بتطبيق "رمز مكافحة التزوير" للنموذج الكبير في القاعة الرئيسية، 24000 بصمة لحام للنموذج ولم تنقلب الأمور.
@SentientAGI 的 OML 1.0 مباشرة دخلت إلى مسار أوراق المؤتمر الرئيسي في NeurIPS - ليس مجرد ملصق للعرض، ولا ورشة عمل هامشية، بل هو المسار الرئيسي الصحيح! هذه الخطوة، رفعت تقنية "توسيم" النموذج الكبير إلى مستوى جديد.
ببساطة، ما قامت به ورقتهم البحثية "Scalable Fingerprinting for LLMs" هو لصق "وشم مضاد للتزوير غير مرئي" على النماذج الكبيرة، وليس مجرد واحد، بل عدة آلاف، ولا يمكن إزالته بأي شكل من الأشكال! كانت الحلول السابقة لبصمات النماذج تبدو وكأنها ملصقات رديئة: بعد إدخال بعض المفاتيح، تبدأ في "تغيير النكهة"، ويبدأ أداء النموذج في التدهور، وبدون أي جهد تختفي بعد غسلتين، واستخدام النماذج مفتوحة المصدر كان بمثابة كارثة. لكن OML 1.0 قامت بشيء جديد - باستخدام "Perinucleus Sampling (عينة عكسية للنواة)" لإدخال البصمة في "المنطقة الحدودية" للنموذج، دون التأثير على مخرجات النموذج، وفي نفس الوقت يمكنها الاحتفاظ بعشرات الآلاف من "رموز التحقق المستقرة"، إنه رائع!
الأكثر غرابة هو أنهم قاموا بإدخال 24576 بصمة على Llama-3.1-8B، ومع ذلك لم تتغير أداء النموذج تقريبًا! حتى لو قمت بإجراء SFT على النموذج، أو قمت بالتقطير، أو حتى خلطت عدة نماذج معًا "تزاوج"، تبقى هذه البصمات ثابتة كالجرو القديم، لا يمكن التخلص منها.
✅ تعرف على الحقيقة بمجرد التحقق، لن تخاف بعد الآن من "نموذج لي غوي"
✅ مخبأة بإحكام، وعند استخدامها لا تشعر بأي شيء على الإطلاق
✅ أداء بدون فقدان، النموذج كيف كان قويًا سيبقى قويًا
✅ تريد أن تدمج بقدر ما تريد، قم بالتوسع بشكل مباشر حتى النهاية
ما هذه الابتكارات التقنية؟ إنها ببساطة تفتح "طريق السماء" لتجارية النماذج مفتوحة المصدر - في المستقبل، من يملك النموذج، وما إذا تم التلاعب به، يمكن معرفة ذلك بنظرة واحدة على "الوشم الخفي"، إنه لطيف للغاية!
@SentientAGI