Les chercheurs présentent la technologie DPN-LE : édition directe des « neurones de personnalité » des grands modèles pour un contrôle fin du personnage IA

robot
Création du résumé en cours

Le 3 mai, le chercheur en intelligence artificielle Brian Roemmele a révélé que sa « Zero-Human Company » a commencé à déployer une technologie de modification de la personnalité d’un grand modèle appelée DPN-LE (Localisation et modification de neurones de la personnalité double) pour ajuster précisément les traits comportementaux des agents IA. Selon l’introduction, DPN-LE localise les « neurones de la personnalité » dans les couches MLP des grands modèles, permettant d’améliorer ou d’affaiblir ciblé des traits tels que « l’honnêteté, la créativité, la prudence et la collaboration ». La recherche affirme que cette méthode nécessite de modifier seulement environ 0,5 % des neurones pour réaliser des ajustements « chirurgicaux » de la personnalité de l’IA sans réentraîner le modèle, tout en minimisant les dommages aux capacités de raisonnement fondamentales. Roemmele a déclaré que sa société compte actuellement plus de 100 agents IA, avec des opérations quotidiennes presque entièrement automatisées, rendant la « cohérence de la personnalité » une question clé. Par exemple, les agents stratégiques renforceront la « cohérence à long terme » et « l’honnêteté analytique », les agents financiers et de contrôle des risques renforceront la « prudence » et la « précision », les agents liés au contenu amélioreront « l’empathie » et la « créativité », et les couches de collaboration multi-agents renforceront la « coopération ». Il a noté que, puisque DPN-LE implique des modifications légères lors de la phase de raisonnement, la société peut « remodeler les personnalités » en masse et déployer de nombreux agents IA en quelques minutes, réduisant ainsi considérablement les coûts d’alignement de l’IA. Le marché considère ce type de technologie de « personnalité programmable » comme un passage d’une simple compétition de capacités entre agents IA à une compétition dans le contrôle comportemental et la gouvernance organisationnelle.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler