Equipe de Stanford estuda a explicação do comportamento de bajulação controlada através da hipótese de externalização do LLM

MeNews · 2026-04-07T01:20:19+00:00

ME News Notícias, 7 de abril (UTC+8), recentemente, um estudo conduzido por várias pesquisadoras, incluindo Myra Cheng, Isabel Sieh, Diyi Yang, entre outras, explorou como "externalizar" as hipóteses internas de grandes modelos de linguagem para explicar e controlar o comportamento de "puxa-saco" que esses modelos exibem em diálogos. O objetivo da pesquisa é revelar os mecanismos internos que levam a esse tipo de comportamento e explorar métodos de intervenção correspondentes. O artigo não menciona métodos específicos de pesquisa, dados experimentais ou descobertas conclusivas. (Fonte: InFoQ)

MeNews

2026-04-07 01:20:19

Notícias da ME, mensagem de 7 de abril (UTC+8): recentemente, um estudo, com a participação de vários investigadores, incluindo Myra Cheng, Isabel Sieh, Diyi Yang, entre outros, analisou como, através da “externalização” das hipóteses internas dos grandes modelos de linguagem, se pode explicar e controlar o comportamento de “subserviência” apresentado pelo modelo nas conversas. O estudo pretende revelar os mecanismos internos pelos quais o modelo produz este tipo de comportamento e explorar métodos de intervenção correspondentes. O artigo não menciona métodos de investigação específicos, dados experimentais ou conclusões definitivas. (Fonte: InFoQ)

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.

2 gostos