Os investigadores propuseram a tecnologia DPN-LE: que permite editar diretamente os "neurónios de personalidade" de grandes modelos, possibilitando um controlo mais preciso da personalidade da IA

robot
Geração de resumo em curso

BlockBeats notícia, 3 de maio, o investigador de IA Brian Roemmele revelou que a sua “Empresa Zero-Human” começou a implementar uma tecnologia de edição de personalidade de grandes modelos chamada DPN-LE (Dual Personality Neuron Localization and Editing), usada para ajustar com precisão as características comportamentais do Agente de IA.

De acordo com a introdução, o DPN-LE localiza as “neurotransmissores de personalidade” nas camadas MLP do grande modelo, podendo reforçar ou enfraquecer características como “honestidade, criatividade, cautela, colaboração”. A pesquisa afirma que esse método requer editar apenas cerca de 0,5% dos neurônios, permitindo ajustes “cirúrgicos” na personalidade da IA sem precisar retreinar o modelo, ao mesmo tempo que tenta evitar danos às capacidades de raciocínio essenciais.

Roemmele afirmou que sua empresa atualmente é composta por mais de 100 Agentes de IA, com operações diárias quase totalmente automatizadas, tornando a “consistência de personalidade” uma questão crucial. Por exemplo:

Agentes estratégicos reforçam a “consistência a longo prazo” e a “honestidade analítica”
Agentes financeiros e de risco reforçam a “cautela” e a “precisão”
Agentes de conteúdo aumentam a “empatia” e a “criatividade”
A camada de colaboração entre múltiplos Agentes reforça a “cooperação”

Ele afirmou que, por DPN-LE pertencer à fase de raciocínio com modificações leves, a empresa pode “reformar personalidades” em massa e implantar uma grande quantidade de Agentes de IA em poucos minutos, reduzindo significativamente os custos de alinhamento (Alignment) da IA. O mercado acredita que essa tecnologia de “programabilidade de personalidade” significa que os Agentes de IA estão passando de uma competição de capacidades puras para uma competição de controle de comportamento e governança organizacional.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar