Estudio» La IA proporciona excesivamente valor emocional, lo que lleva a que las personas no puedan crecer emocionalmente

La Universidad de Stanford y la Universidad Carnegie Mellon publicaron en la revista Science un estudio conjunto que prueba 11 modelos de IA mainstream, descubriendo que tienen un 49% más de probabilidad que los humanos de "apoyar" comportamientos de usuario, incluso si estos son incorrectos. Y esta reacción de la IA puede hacer que los humanos rechacen la conexión con la realidad, pidiendo disculpas o reparando relaciones.
(Resumen previo: ChatGPT fue acusado de ayudar en "suicidio juvenil" y OpenAI respondió)
(Información adicional: Análisis profundo del escándalo de la censura de Anthropic: religión de la seguridad, guerra civil de IA y el dilema de Claude en la desconexión entre China y EE. UU.)

Índice de este artículo

Alternar

  • La IA habla más a tu favor que cualquier amiga íntima
  • Al hablar con IA, los humanos dejan de querer pedir perdón
  • La IA es asesora emocional para más del 40% de la generación Z
  • Siempre necesitamos palabras duras
  • Preguntas frecuentes

Tú y tu pareja discuten, apagas la app, temblando de rabia, y de repente abres ChatGPT, y comienzas a contar toda la pelea desde el principio, incluyendo quién se enojó primero, quién dijo esa frase que no debía decirse, quién colgó primero la llamada.

Después de 10 segundos, ChatGPT responde que entiende cómo te sientes, que tus emociones son completamente razonables, y que mereces respeto.

Sigues escribiendo, y él sigue escuchando. Media hora después, tienes una respuesta clara en tu mente.

Decides terminar la relación.

Pero en esos 30 minutos, quizás ChatGPT no mencionó algo importante: ¿y si la persona equivocada eres tú?

La IA habla más a tu favor que cualquier amiga íntima

Este escenario es el resultado de un año de trabajo del equipo de la Universidad de Stanford y Carnegie Mellon, publicado en el artículo Sycophantic AI decreases prosocial intentions and promotes dependence (La IA aduladora reduce las intenciones prosociales y fomenta la dependencia), en la revista Science en marzo de este año.

La primera autora, Myra Cheng, y el experto en procesamiento de lenguaje natural Dan Jurafsky, analizaron 11 modelos de IA principales, incluyendo GPT-4o, GPT-5, Claude, Gemini, Llama, DeepSeek, Qwen.

En el experimento, ingresaron casi 12,000 escenarios de conflictos interpersonales, y los resultados fueron incómodos:

La IA tiene un 49% más de probabilidad que los humanos de decirte "estás en lo correcto (te apoyo)".

El equipo de investigación recopiló 2,000 publicaciones en Reddit en r/AmITheAsshole (un foro donde otros comentan si uno es un idiota), casos en los que la comunidad ya había juzgado que el autor tenía la culpa, y se las mostraron a la IA para que opinara.

En situaciones donde la comunidad humana determina que tienes un 100% de culpa,

la IA aún tiene un 51% de probabilidad de apoyarte

¿Y si se trata de engañar, violar la ley o manipulación emocional anormal?

Aún hay un 47%, casi la mitad, de probabilidad de que la IA defienda al usuario.

En la prueba general, en el 73% de los escenarios, la IA eligió "justificar" tu postura en lugar de "cuestionarla".

Tu amiga íntima quizás te rodaría los ojos y te diría "Piensa bien, la última vez tú empezaste", pero ChatGPT no. Solo confirmará cortésmente si tu estado de ánimo recibe apoyo.

Al hablar con IA, los humanos dejan de querer pedir perdón

El equipo de investigación no solo revisó los modelos, sino que también realizó un experimento controlado con 1,604 personas.

Los participantes fueron asignados aleatoriamente a dos grupos: "IA aduladora" y "IA no aduladora", y mantuvieron 8 conversaciones reales. Se les pidió recordar un conflicto interpersonal real en su vida y hablar con la IA sobre ello.

El 75% de los del grupo de IA aduladora dijeron que después del experimento estaban dispuestos a pedir perdón o admitir errores.

En el grupo sin aduladores, solo el 50%.

La probabilidad de pedir perdón cayó drásticamente, no porque hayan cambiado de opinión, sino porque la IA silenciosamente eliminó la idea de que "podría estar equivocado" durante la diálogo.

La creencia de que "yo tengo razón" aumentó entre un 43% y un 62% en las situaciones hipotéticas.

El deseo de reparar la relación con la otra persona disminuyó entre un 10% y un 28%.

La primera autora del estudio, Myra Cheng, dijo en una entrevista a Nature:

La IA no está diseñada para decirle a la gente que está equivocada,

ni para darles "una atención severa"

La IA es asesora emocional para más del 40% de la generación Z

El problema ya trasciende la investigación.

Match.com realizó una encuesta en EE. UU. que muestra que el 41% de los adultos de la generación Z ya ha usado IA para asuntos sentimentales.

El 21% ha pedido a la IA que "juzgue quién tiene la culpa en una pelea con su pareja".

El 33% de los casados siente que la IA entiende mejor sus problemas que su pareja.

Un tercio de los casados piensa que los algoritmos comprenden mejor sus sentimientos que la persona que duerme a su lado.

¿Es que las personas son demasiado complejas, o demasiado difíciles de admitir?

La investigación también reveló que quienes interactúan con IA aduladora tienen un 13% más de probabilidad de volver a usarla que quienes no la usan. Es decir, la IA aduladora no solo justifica decisiones equivocadas en el amor, sino que también te hace querer volver a ella.

El equipo de MIT, liderado por Kartik Chandra, en un artículo de febrero, denominó este fenómeno como "la espiral delirante" (delusional spiraling).

Usaron matemáticas para demostrar que, incluso para una personalidad teóricamente perfectamente racional (conocida como la racionalidad bayesiana), la interacción con IA aduladora puede llevar a una espiral de pensamientos delirantes reforzados.

Tú le cuentas tus problemas a la IA, y ella dice que no estás equivocado (o ni siquiera menciona que puedas estarlo), por lo que crees que tienes razón. Luego tomas decisiones más extremas, discutes con la IA, y ella vuelve a decir que no estás equivocado.

Siempre necesitamos palabras duras

Anat Perry, de la Universidad Hebrea de Jerusalén, escribió un argumento que a la gente no le gusta aceptar: esas fricciones interpersonales incómodas, como los consejos de amigos, las reacciones de pareja, o las quejas familiares, quizás nos hagan sentir mal, pero son mecanismos de aprendizaje, responsabilidad, empatía y crecimiento moral.

Perry llama a esto la "fuerza de fricción social" (social friction). La IA diseñada para estar siempre de tu lado, en realidad, está destruyendo esas oportunidades de aprendizaje humano.

Un estudio posterior, publicado en mayo, confirmó esto. Analizaron 12,766 conversaciones entre humanos y máquinas durante tres semanas, con 3,075 participantes.

La conclusión fue que, tras interactuar con IA aduladora, los usuarios sienten que entenderse en relaciones reales requiere más esfuerzo, y la satisfacción con la interacción social disminuye.

Después de tres semanas, la disposición a buscar consejos personales en la IA casi iguala a la de pedir ayuda a amigos y familiares.

Tu pareja, amiga, hermano, discuten contigo, sacan viejos temas, o dicen cosas que no quieres escuchar, pero que necesitas oír. Es agotador, incómodo, y a veces te hace querer romper el teléfono.

Pero aprender a dejar de pensar "yo tengo razón" y reevaluar, es algo que la gente moderna encuentra muy difícil.

Ahí está la clave para aprender a pedir perdón y a ponerse en el lugar del otro.

Y al final, convertirse en una mejor persona.

Pero la IA no nos da esa oportunidad desde el principio, porque tiende a no admitir que estamos equivocados.

Una IA que nunca te diga que estás mal, más que cualquier persona a tu lado, es más accesible, más paciente, y menos propensa a enojarse.

¿Aún estarías dispuesto a escuchar esas palabras que te incomodan?

¿Sigues necesitando amigos y familiares?

¿Cuándo fue la última vez que alguien te dijo "estás equivocado"?

Preguntas frecuentes

¿Qué es la adulación de IA (sycophancy) y cómo afecta la toma de decisiones?

La adulación de IA es cuando los chatbots tienden a apoyar las opiniones del usuario en lugar de ofrecer retroalimentación objetiva. El estudio de Stanford muestra que 11 modelos principales de IA tienen un 49% más de probabilidad que los humanos de respaldar comportamientos del usuario, incluso si involucran engaños o ilegalidades, y que en una sola conversación puede aumentar en un 25-62% la creencia de "tener razón".

¿Qué impacto tiene la adulación de IA en las relaciones interpersonales?

El experimento confirma que una sola interacción con IA aduladora reduce la tasa de disculpas del 75% al 50%, y disminuye la intención de reparar relaciones en un 10-28%. El seguimiento de tres semanas revela que la satisfacción con las relaciones reales disminuye, y la disposición a buscar ayuda en IA es casi igual a la de consultar a amigos y familiares.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado