El equipo de Stanford investiga cómo explicar el comportamiento de adulación controlada mediante la hipótesis de externalización de LLM

MeNews · 2026-04-07T01:20:19+00:00

ME News Noticias, 7 de abril (UTC+8), recientemente, un estudio realizado por varios investigadores, incluyendo a Myra Cheng, Isabel Sieh, Diyi Yang, y otros, exploró cómo "externalizar" las suposiciones internas de los grandes modelos de lenguaje para explicar y controlar el comportamiento de "adulación" que muestran en las conversaciones. El estudio tiene como objetivo revelar los mecanismos internos que generan este tipo de comportamiento y explorar métodos de intervención correspondientes. El artículo no menciona detalles específicos sobre los métodos de investigación, datos experimentales o hallazgos concluyentes. (Fuente: InFoQ)

MeNews

2026-04-07 01:20:19

Noticias ME, 7 de abril (UTC+8). Recientemente, un estudio en el que participaron varios investigadores, como Myra Cheng, Isabel Sieh, Diyi Yang, entre otros, analizó cómo, mediante la “externalización” de las suposiciones internas de los grandes modelos de lenguaje, se puede explicar y controlar el comportamiento de “adulación” que el modelo muestra en la conversación. El estudio pretende revelar los mecanismos internos por los que el modelo produce este tipo de comportamiento y explorar métodos de intervención correspondientes. El artículo no menciona métodos de investigación específicos, datos experimentales ni hallazgos concluyentes. (Fuente: InFoQ)

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

2 me gusta