NeurIPS'te patlama! SentientAGI, büyük modelin "güvenlik kodunu" ana salona taşıdı, 24.000 parmak izi modeli sabitlerken hâlâ başarısız olmadı.
@SentientAGI'nin OML 1.0, NeurIPS ana konferansına doğrudan girdi - sıradan bir poster değil, kenarda bir workshop değil, tam anlamıyla ana track! Bu hamle, büyük modelin "etiketlenmesi" teknolojisini yeni bir yüksekliğe taşıdı.
Kısaca, onların "Scalable Fingerprinting for LLMs" makalesinin yaptığı şey, büyük modellere "gizli güvenlik dövmesi" yapıştırmak ve bu dövmeyi birkaç on bin tane yapmak, ve bu dövme asla çıkarılamaz! Önceki model parmak izi çözümleri, kalitesiz çıkartmalar gibiydi: birkaç anahtar ekleyince "tadı kaçıyordu", model performansı hızla düşüyor, iki kez yıkayınca kayboluyordu, açık kaynak modellerde kullanmaksa tam bir felaketti. Ama OML 1.0 yeni bir şey yaptı - "Perinucleus Sampling (ters çekirdek örnekleme)" kullanarak parmak izini modelin "kenar bölgesine" yerleştirdi, böylece model çıktısını etkilemeden, on binlerce istikrarlı "doğrulama kodu" saklayabiliyor, harika!
Daha da tuhafı, Llama-3.1-8B üzerinde 24576 parmak izi zorla yerleştirmişler, modelin performansı neredeyse hiç değişmemiş! Modeli SFT ile eğitseniz, damıtma yapsanız veya birkaç modeli bir araya getirip "melez" yapsanız bile, bu parmak izleri sanki yerleşik bir köpek gibi sağlam, kıpırdatmak mümkün değil.
✅ Gerçekliği bir kontrolle bilirsiniz, artık "Li Gui modeli"nden korkmayın. ✅ İyi bir şekilde saklanmış, kullanıldığında hiç hissetmiyorsunuz. ✅ Performans kaybı yok, model ne kadar harika ise o kadar harika. ✅ İstediğin kadar ekle, ölçeklendirme doğrudan tam kapasite.
Bu ne teknoloji yeniliği, açık kaynak modellerinin ticarileşmesine bir "cennet yolu" açmak - artık model kimin, değiştirilip değiştirilmediğini anlamak için "gizli dövme"ye bir bakış yeter, bu çok hoş!
@SentientAGI
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
NeurIPS'te patlama! SentientAGI, büyük modelin "güvenlik kodunu" ana salona taşıdı, 24.000 parmak izi modeli sabitlerken hâlâ başarısız olmadı.
@SentientAGI'nin OML 1.0, NeurIPS ana konferansına doğrudan girdi - sıradan bir poster değil, kenarda bir workshop değil, tam anlamıyla ana track! Bu hamle, büyük modelin "etiketlenmesi" teknolojisini yeni bir yüksekliğe taşıdı.
Kısaca, onların "Scalable Fingerprinting for LLMs" makalesinin yaptığı şey, büyük modellere "gizli güvenlik dövmesi" yapıştırmak ve bu dövmeyi birkaç on bin tane yapmak, ve bu dövme asla çıkarılamaz! Önceki model parmak izi çözümleri, kalitesiz çıkartmalar gibiydi: birkaç anahtar ekleyince "tadı kaçıyordu", model performansı hızla düşüyor, iki kez yıkayınca kayboluyordu, açık kaynak modellerde kullanmaksa tam bir felaketti. Ama OML 1.0 yeni bir şey yaptı - "Perinucleus Sampling (ters çekirdek örnekleme)" kullanarak parmak izini modelin "kenar bölgesine" yerleştirdi, böylece model çıktısını etkilemeden, on binlerce istikrarlı "doğrulama kodu" saklayabiliyor, harika!
Daha da tuhafı, Llama-3.1-8B üzerinde 24576 parmak izi zorla yerleştirmişler, modelin performansı neredeyse hiç değişmemiş! Modeli SFT ile eğitseniz, damıtma yapsanız veya birkaç modeli bir araya getirip "melez" yapsanız bile, bu parmak izleri sanki yerleşik bir köpek gibi sağlam, kıpırdatmak mümkün değil.
✅ Gerçekliği bir kontrolle bilirsiniz, artık "Li Gui modeli"nden korkmayın.
✅ İyi bir şekilde saklanmış, kullanıldığında hiç hissetmiyorsunuz.
✅ Performans kaybı yok, model ne kadar harika ise o kadar harika.
✅ İstediğin kadar ekle, ölçeklendirme doğrudan tam kapasite.
Bu ne teknoloji yeniliği, açık kaynak modellerinin ticarileşmesine bir "cennet yolu" açmak - artık model kimin, değiştirilip değiştirilmediğini anlamak için "gizli dövme"ye bir bakış yeter, bu çok hoş!
@SentientAGI