Los investigadores presentan la tecnología DPN-LE: edición directa de las 'neuronas de personalidad' de modelos grandes para un control preciso del carácter de IA

robot
Generación de resúmenes en curso

El 3 de mayo, el investigador de IA Brian Roemmele reveló que su ‘Empresa Cero-Humana’ ha comenzado a desplegar una tecnología de edición de personalidad de modelos grandes llamada DPN-LE (Localización y Edición de Neuronas de Personalidad Dual) para ajustar con precisión los rasgos conductuales de los Agentes de IA. Según la introducción, DPN-LE localiza las ‘neuronas de personalidad’ dentro de las capas MLP de los modelos grandes, permitiendo mejorar o debilitar de manera dirigida rasgos como ‘honestidad, creatividad, precaución y colaboración.’ La investigación afirma que este método requiere editar solo alrededor del 0,5% de las neuronas para lograr ajustes ‘quirúrgicos’ en la personalidad de la IA sin volver a entrenar el modelo, minimizando al mismo tiempo el daño a las capacidades de razonamiento central. Roemmele declaró que su empresa actualmente consta de más de 100 Agentes de IA, con operaciones diarias casi completamente automatizadas, haciendo que la ‘consistencia de la personalidad’ sea un tema clave. Por ejemplo, los Agentes estratégicos mejorarán la ‘coherencia a largo plazo’ y la ‘honestidad analítica,’ los Agentes financieros y de control de riesgos fortalecerán la ‘precaución’ y la ‘precisión,’ los Agentes relacionados con contenido mejorarán la ‘empatía’ y la ‘creatividad,’ y las capas de colaboración multi-Agente potenciarán la ‘cooperación.’ Señaló que, dado que DPN-LE implica modificaciones ligeras durante la fase de razonamiento, la empresa puede ‘reformar personalidades’ en masa y desplegar numerosos Agentes de IA en minutos, reduciendo significativamente los costos de alineación de IA. El mercado ve esta tecnología de ‘personalidad programable’ como un cambio de la mera competencia en capacidades entre Agentes de IA a una competencia en control conductual y gobernanza organizacional.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado