Pesquisadores apresentam a tecnologia DPN-LE: edição direta dos 'neurônios de personalidade' de grandes modelos para controlo de personagens de IA ajustados finamente

robot
Geração de resumo em curso

Em 3 de maio, o investigador de IA Brian Roemmele revelou que a sua ‘Empresa Zero-Human’ começou a implementar uma tecnologia de edição de personalidade de modelos grandes chamada DPN-LE (Localização e Edição de Neurônios de Personalidade Dual) para ajustar com precisão os traços comportamentais dos Agentes de IA. Segundo a introdução, o DPN-LE localiza ‘neurônios de personalidade’ dentro das camadas MLP de modelos grandes, permitindo a melhoria ou enfraquecimento direcionado de traços como ‘honestidade, criatividade, cautela e colaboração.’ A pesquisa afirma que este método requer editar apenas cerca de 0,5% dos neurônios para alcançar ajustes ‘cirúrgicos’ na personalidade da IA sem re-treinar o modelo, minimizando danos às capacidades de raciocínio essenciais. Roemmele afirmou que a sua empresa atualmente conta com mais de 100 Agentes de IA, com operações diárias quase totalmente automatizadas, tornando a ‘consistência de personalidade’ uma questão-chave. Por exemplo, Agentes estratégicos irão melhorar a ‘consistência a longo prazo’ e a ‘honestidade analítica,’ Agentes financeiros e de controle de risco irão fortalecer a ‘cautela’ e a ‘precisão,’ Agentes relacionados a conteúdo irão aprimorar a ‘empatia’ e a ‘criatividade,’ e camadas de colaboração multi-Agentes irão reforçar a ‘cooperação.’ Ele observou que, como o DPN-LE envolve modificações leves durante a fase de raciocínio, a empresa pode ‘reformar personalidades’ em massa e implantar inúmeros Agentes de IA em minutos, reduzindo significativamente os custos de alinhamento de IA. O mercado vê esse tipo de tecnologia de ‘personalidade programável’ como uma mudança da mera competição de capacidades entre Agentes de IA para uma competição no controle comportamental e na governança organizacional.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar