El equipo de Stanford investiga cómo explicar el comportamiento de adulación controlada mediante la hipótesis de externalización de LLM

Noticias ME, 7 de abril (UTC+8). Recientemente, un estudio en el que participaron varios investigadores, como Myra Cheng, Isabel Sieh, Diyi Yang, entre otros, analizó cómo, mediante la “externalización” de las suposiciones internas de los grandes modelos de lenguaje, se puede explicar y controlar el comportamiento de “adulación” que el modelo muestra en la conversación. El estudio pretende revelar los mecanismos internos por los que el modelo produce este tipo de comportamiento y explorar métodos de intervención correspondientes. El artículo no menciona métodos de investigación específicos, datos experimentales ni hallazgos concluyentes. (Fuente: InFoQ)

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado