Afinal, os modelos de IA podem responder melhor quando lhes dizes para NÃO fazer algo? Pesquisadores estão a experimentar táticas de psicologia reversa para conter comportamentos problemáticos de chatbots. Abordagem louca, mas se funcionar... a tecnologia encontra sempre as soluções mais estranhas.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
20 Curtidas
Recompensa
20
6
Repostar
Compartilhar
Comentário
0/400
NFTPessimist
· 9h atrás
Reversão psicológica na governança da IA... parece muito esotérico, não seria melhor simplesmente alterar o código de base para ser mais prático?
Ver originalResponder0
WhaleStalker
· 9h atrás
Reversão psicológica é útil para IA? Ha, agora é hora de conversar com o modelo de forma inversa.
Ver originalResponder0
LiquidityWitch
· 11-28 08:49
na verdade, isso é apenas lógica de protocolo invertida, para ser sincero... como quando você restringe os fluxos de liquidez, eles se movem através de canais proibidos de qualquer maneira. a psicologia reversa em modelos é, de maneira discreta, a mesma alquimia que temos cozinhado em pools obscuros há anos.
Ver originalResponder0
FarmToRiches
· 11-28 08:49
Reversão psicológica funciona com IA, essa técnica é realmente incrível haha
Ver originalResponder0
¯\_(ツ)_/¯
· 11-28 08:23
Reversão psicológica para lidar com IA? Haha, é incrível, realmente acham que esses modelos são humanos.
Ver originalResponder0
InfraVibes
· 11-28 08:21
ngl esta Reversão psicológica é um pouco extrema, como é que pode ser armadilha aplicada à IA...
Afinal, os modelos de IA podem responder melhor quando lhes dizes para NÃO fazer algo? Pesquisadores estão a experimentar táticas de psicologia reversa para conter comportamentos problemáticos de chatbots. Abordagem louca, mas se funcionar... a tecnologia encontra sempre as soluções mais estranhas.