Explosão no NeurIPS! SentientAGI levou o "código de segurança" do grande modelo para o palco principal, 24 mil impressões digitais soldadas no modelo ainda não falhou.



@SentientAGI's OML 1.0 went straight into the main track of the NeurIPS conference - not just a poster for show, nor a marginal workshop, but the real main track! This move has taken the technology of "tagging" large models to a new height.

Simplificando, o que eles fizeram no artigo "Scalable Fingerprinting for LLMs" foi colocar "tatuagens invisíveis de segurança" em grandes modelos, e uma vez aplicadas, são dezenas de milhares, e não saem de jeito nenhum! As soluções de impressão digital anteriores eram como adesivos de qualidade inferior: inserindo algumas chaves, começavam a "misturar sabores", o desempenho do modelo caía drasticamente, e após algumas limpezas, desapareciam, sendo um verdadeiro desastre para modelos de código aberto. Mas o OML 1.0 trouxe uma nova abordagem - usando "Perinucleus Sampling (amostragem inversa de núcleo)" para inserir a impressão digital na "zona de borda" do modelo, sem afetar a saída do modelo, enquanto mantinha milhares de "códigos de verificação" estáveis, incrível!

Mais absurdo ainda, eles incrustaram 24576 impressões digitais no Llama-3.1-8B, e o desempenho do modelo quase não mudou! Mesmo que você faça SFT no modelo, realize destilação, ou até misture alguns modelos em um "híbrido", essas impressões digitais continuam firmes como uma rocha, não dá para se livrar delas.

✅ A autenticidade é fácil de verificar, não temos mais medo do "modelo Li Gui"
✅ Escondido de forma segura, quando usado, não se sente nada
✅ Desempenho sem perdas, o modelo continua tão poderoso como sempre.
✅ Quer embutir o quanto quiser, escalar diretamente ao máximo

Isso não é inovação tecnológica, é simplesmente abrir um "caminho para o céu" para a comercialização de modelos de código aberto - no futuro, de quem é o modelo, se foi alterado ou não, pode-se saber com um olhar para o "tatuagem invisível", é muito bom!

@SentientAGI
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • 1
  • Republicar
  • Partilhar
Comentar
0/400
RiseFromTheAshes!vip
· 10-17 12:00
Firme HODL💎
Ver originalResponder0
  • Fixar
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)