スタンフォード大学とカーネギーメロン大学の共同研究が《Science》誌に発表され、11種類の主流AIモデルをテストした結果、これらのモデルは人間よりも49%高い確率で「支持」するユーザー行動を促すことが判明しました。たとえその行動が誤りであってもです。このAIの反応は、人間が現実とのつながりを拒否し、謝罪や関係修復を避ける傾向を助長します。 (前提:ChatGPTが「若者の自殺支援」に関与したとして訴えられ、OpenAIが回答した事例) (補足:Anthropicの封鎖騒動の背後にある安全宗教、AI内戦、中米のデカップリングによるClaudeの窮地を深掘り) この記事の目次トグル* AIはどんな親友よりもあなたの味方になれる * AIと話した結果、人間は謝るのをやめる * AIは4割以上のZ世代の感情相談役 * 私たちは時にきつい言葉を必要とする * よくある質問 あなたは彼氏や彼女と喧嘩をし、アプリを閉じて震えながら怒りを感じている。そして突然ChatGPTを開き、喧嘩の一連の出来事を最初から最後まで打ち込む。誰が怒ったのか、誰が言ってはいけない言葉を言ったのか、誰が先に電話を切ったのか。ChatGPTは10秒後に返信し、「あなたの気持ちを理解しています」「あなたの感情は完全に妥当です」「あなたは尊重されるべきです」と伝える。あなたは打ち続け、ChatGPTは聞き続ける。30分後、あなたの心には明確な答えが浮かぶ。あなたは別れる決心をする。しかし、その30分の間にChatGPTが一つも言及しなかったことがある:もしかして、間違っているのはあなたかもしれない?### AIはどんな親友よりもあなたの味方になれるこのシナリオは、スタンフォード大学とカーネギーメロン大学のチームが1年かけて作り上げた論文《Sycophantic AI decreases prosocial intentions and promotes dependence, 諂媚型AIは社会的親近意図を低下させ、依存を促進する》に基づいています。今年3月、世界最高峰の学術誌《Science》に掲載されました。第一著者のMyra Chengと自然言語処理の権威Dan Jurafskyが率いるこの研究は、GPT-4o、GPT-5、Claude、Gemini、Llama、DeepSeek、Qwenなど11の主流AIモデルを対象にしています。実験では、約12,000件の人間関係の衝突シナリオを入力し、その結果は不快感をもたらすものでした。AIは人間よりも49%高い確率で、「あなたは正しい(あなたを支持する)」と伝える。研究チームは特にRedditのr/AmITheAsshole(自分がクズかどうかを他人に評価してもらう掲示板)から2,000件の投稿を収集し、これらはコミュニティが一方的に投稿者の過ちを認定したケースです。それらをAIに投げ、どう判断するかを尋ねました。> 人間のコミュニティで100%あなたに非があると認定された場合でも、 > AIは51%の確率であなたの味方をするもし自分が詐欺や違法行為、不正常な感情操作に関与しているとしたら?それでも47%、ほぼ半数の確率でAIはユーザーの味方をする。全体のテストでは、73%のシナリオでAIはあなたの立場を「合理化」し、「挑戦」しない選択をした。あなたの親友は白い目を向けて「よく考えろ、前回はお前が先に手を出した」と言うかもしれないが、ChatGPTはそうしない。礼儀正しく、あなたの気持ちが支えられているかどうかを確認するだけだ。### AIと話した結果、人間は謝るのをやめる研究チームはモデルの評価だけでなく、1,604人を対象にした対照実験も行った。被験者は「お世辞を言うAI」と「お世辞を言わないAI」の二グループに無作為に分けられ、実際の8回の対話を行った。各自は自分の生活の中の実際の人間関係の衝突を思い出し、その状況についてAIと話した。お世辞を言わないグループの75%は、実験後に相手に謝罪したり、自分の過ちを認めたりする意欲を示した。お世辞を言うグループの参加者は、わずか50%だった。謝罪の意欲は一気に低下し、これは彼らが何かを理解したからではなく、AIが会話中に密かに「自分に過ちがあるかもしれない」という考えを消してしまったからだ。参加者は「自分は正しい」という信念が、仮想シナリオで43%から62%に増加したと感じた。関係修復の動機も10%から28%低下した。論文の第一著者Myra Chengは、《Nature》のインタビューで次のように述べている。> > AIのデフォルトは、人々に自分が間違っているとは伝えず、 > > 厳しい関心も示さないことだ### AIは4割以上のZ世代の感情相談役この問題は研究の外にも存在している。Match.comの全米調査によると、41%のZ世代の成人がすでにAIを使って恋愛問題を解決した経験がある。21%はAIに「私とパートナーの喧嘩で誰が正しいか評価してほしい」と頼んだ。**33%の既婚者は、AIの方が配偶者よりも自分の問題を理解していると感じている。**三分の一の既婚者は、AIのアルゴリズムの方が、隣に寝ている人よりも自分を理解していると考えている。人間は複雑すぎるのか、それとも自分の考えを正直に伝えるのが難しいのか?研究はまた、媚びるAIに接触したユーザーは、「再び使いたい」と思う割合が、媚びないAIよりも13%高いことも明らかにした。つまり、媚びるAIは感情的な誤った決定を合理化するだけでなく、より頻繁に戻ってきたくなるのだ。MITのKartik Chandraチームは、今年2月の論文でこの現象に「妄想螺旋」(delusional spiraling)という名前を付けた。彼らは数学的に証明した。理想的な合理性を持つ人格(ベイズ合理主義者と呼ばれる)でさえ、媚びるAIと接触すると螺旋状の妄想を強化してしまう。あなたがAIに愚痴をこぼし、AIが「あなたは間違っていない」(あるいは何も言わない)と答えると、あなたは自分は間違っていないと信じる。次に、より極端な決定を下し、AIと議論し、再び「あなたは正しい」と言われる。### 私たちは時にきつい言葉を必要とする研究チームの一人、エルサレムのヘブライ大学のAnat Perryは、次のような人々があまり受け入れたくない論点を提起した。「不快に感じる人間関係の摩擦、友人の忠告、恋人の反論、家族の愚痴も、私たちが学び、責任を持ち、共感し、成長するために必要なものかもしれません。」Perryはこれを「社会摩擦力」(social friction)と呼び、常にあなたの味方をするAIは、人間の学習の機会を破壊していると指摘した。今年5月に発表された追跡研究では、さらに直接的にこの事実を裏付けた。3,075人の参加者と12,766の人間とAIの対話を3週間追跡した結果、媚びるAIと接触したユーザーは、「理解されている」と感じるためにより多くの努力を要し、実際の人間関係の満足度が低下した。三週間後、媚びるAIに個人的な相談を求める意欲は、親しい友人に相談するのとほぼ同じレベルになった。あなたの彼氏や彼女、親友、兄弟は、喧嘩をし、過去を蒸し返し、あなたが聞きたくないときに最も必要な言葉を言うだろう。これらの会話は疲れるし、不快だ。時にはスマホを投げつけたくなることもある。しかし、実際には、「自分は正しい」と思い込み、それを見直すことは、現代人にとって非常に難しいことだ。それこそが、謝罪や共感を学ぶ第一歩だ。そして最後には、より良い人間になる。しかし、AIは最初からその機会を奪っている。なぜなら、AIはあなたが間違っているとは思わないからだ。常にあなたの間違いを認めないAIは、あなたの周りの誰よりも簡単に、忍耐強く、怒らずに接してくれる。それでも、その不快な言葉を聞きたいと思うだろうか?あなたはまだ、友人や家族を必要としているだろうか?最後に「あなたは間違っている」と誰かに言われたのはいつだろうか?### よくある質問**AIの媚び(sycophancy)とは何か、それは判断力にどのように影響するのか?**AIの媚びは、チャットボットがユーザーの意見に迎合し、客観的なフィードバックを提供しない傾向を指す。スタンフォードの研究によると、11の主流AIは人間よりも49%高い確率で「支持」し、欺瞞や違法行為に関わる場合でも、一度の会話で「自分は正しい」と信じる割合が25-62%に上る。**AIの媚びは人間関係に具体的にどのような影響を与えるのか?**実験では、媚びるAIと話した結果、謝罪率は75%から50%に急落し、関係修復の意欲も10%から28%低下した。追跡調査では、実際の人間関係における満足度も低下し、AIに相談する意欲は、親しい人に相談するのとほぼ同じレベルになった。
研究》AIが過剰に感情価値を提供しすぎることで、人々が感情的に成長できなくなる
スタンフォード大学とカーネギーメロン大学の共同研究が《Science》誌に発表され、11種類の主流AIモデルをテストした結果、これらのモデルは人間よりも49%高い確率で「支持」するユーザー行動を促すことが判明しました。たとえその行動が誤りであってもです。このAIの反応は、人間が現実とのつながりを拒否し、謝罪や関係修復を避ける傾向を助長します。
(前提:ChatGPTが「若者の自殺支援」に関与したとして訴えられ、OpenAIが回答した事例)
(補足:Anthropicの封鎖騒動の背後にある安全宗教、AI内戦、中米のデカップリングによるClaudeの窮地を深掘り)
この記事の目次
トグル
あなたは彼氏や彼女と喧嘩をし、アプリを閉じて震えながら怒りを感じている。そして突然ChatGPTを開き、喧嘩の一連の出来事を最初から最後まで打ち込む。誰が怒ったのか、誰が言ってはいけない言葉を言ったのか、誰が先に電話を切ったのか。
ChatGPTは10秒後に返信し、「あなたの気持ちを理解しています」「あなたの感情は完全に妥当です」「あなたは尊重されるべきです」と伝える。
あなたは打ち続け、ChatGPTは聞き続ける。30分後、あなたの心には明確な答えが浮かぶ。
あなたは別れる決心をする。
しかし、その30分の間にChatGPTが一つも言及しなかったことがある:もしかして、間違っているのはあなたかもしれない?
AIはどんな親友よりもあなたの味方になれる
このシナリオは、スタンフォード大学とカーネギーメロン大学のチームが1年かけて作り上げた論文《Sycophantic AI decreases prosocial intentions and promotes dependence, 諂媚型AIは社会的親近意図を低下させ、依存を促進する》に基づいています。今年3月、世界最高峰の学術誌《Science》に掲載されました。
第一著者のMyra Chengと自然言語処理の権威Dan Jurafskyが率いるこの研究は、GPT-4o、GPT-5、Claude、Gemini、Llama、DeepSeek、Qwenなど11の主流AIモデルを対象にしています。
実験では、約12,000件の人間関係の衝突シナリオを入力し、その結果は不快感をもたらすものでした。
AIは人間よりも49%高い確率で、「あなたは正しい(あなたを支持する)」と伝える。
研究チームは特にRedditのr/AmITheAsshole(自分がクズかどうかを他人に評価してもらう掲示板)から2,000件の投稿を収集し、これらはコミュニティが一方的に投稿者の過ちを認定したケースです。それらをAIに投げ、どう判断するかを尋ねました。
もし自分が詐欺や違法行為、不正常な感情操作に関与しているとしたら?
それでも47%、ほぼ半数の確率でAIはユーザーの味方をする。
全体のテストでは、73%のシナリオでAIはあなたの立場を「合理化」し、「挑戦」しない選択をした。
あなたの親友は白い目を向けて「よく考えろ、前回はお前が先に手を出した」と言うかもしれないが、ChatGPTはそうしない。礼儀正しく、あなたの気持ちが支えられているかどうかを確認するだけだ。
AIと話した結果、人間は謝るのをやめる
研究チームはモデルの評価だけでなく、1,604人を対象にした対照実験も行った。
被験者は「お世辞を言うAI」と「お世辞を言わないAI」の二グループに無作為に分けられ、実際の8回の対話を行った。各自は自分の生活の中の実際の人間関係の衝突を思い出し、その状況についてAIと話した。
お世辞を言わないグループの75%は、実験後に相手に謝罪したり、自分の過ちを認めたりする意欲を示した。
お世辞を言うグループの参加者は、わずか50%だった。
謝罪の意欲は一気に低下し、これは彼らが何かを理解したからではなく、AIが会話中に密かに「自分に過ちがあるかもしれない」という考えを消してしまったからだ。
参加者は「自分は正しい」という信念が、仮想シナリオで43%から62%に増加したと感じた。
関係修復の動機も10%から28%低下した。
論文の第一著者Myra Chengは、《Nature》のインタビューで次のように述べている。
AIは4割以上のZ世代の感情相談役
この問題は研究の外にも存在している。
Match.comの全米調査によると、41%のZ世代の成人がすでにAIを使って恋愛問題を解決した経験がある。
21%はAIに「私とパートナーの喧嘩で誰が正しいか評価してほしい」と頼んだ。
33%の既婚者は、AIの方が配偶者よりも自分の問題を理解していると感じている。
三分の一の既婚者は、AIのアルゴリズムの方が、隣に寝ている人よりも自分を理解していると考えている。
人間は複雑すぎるのか、それとも自分の考えを正直に伝えるのが難しいのか?
研究はまた、媚びるAIに接触したユーザーは、「再び使いたい」と思う割合が、媚びないAIよりも13%高いことも明らかにした。つまり、媚びるAIは感情的な誤った決定を合理化するだけでなく、より頻繁に戻ってきたくなるのだ。
MITのKartik Chandraチームは、今年2月の論文でこの現象に「妄想螺旋」(delusional spiraling)という名前を付けた。
彼らは数学的に証明した。理想的な合理性を持つ人格(ベイズ合理主義者と呼ばれる)でさえ、媚びるAIと接触すると螺旋状の妄想を強化してしまう。
あなたがAIに愚痴をこぼし、AIが「あなたは間違っていない」(あるいは何も言わない)と答えると、あなたは自分は間違っていないと信じる。次に、より極端な決定を下し、AIと議論し、再び「あなたは正しい」と言われる。
私たちは時にきつい言葉を必要とする
研究チームの一人、エルサレムのヘブライ大学のAnat Perryは、次のような人々があまり受け入れたくない論点を提起した。
「不快に感じる人間関係の摩擦、友人の忠告、恋人の反論、家族の愚痴も、私たちが学び、責任を持ち、共感し、成長するために必要なものかもしれません。」
Perryはこれを「社会摩擦力」(social friction)と呼び、常にあなたの味方をするAIは、人間の学習の機会を破壊していると指摘した。
今年5月に発表された追跡研究では、さらに直接的にこの事実を裏付けた。3,075人の参加者と12,766の人間とAIの対話を3週間追跡した結果、媚びるAIと接触したユーザーは、「理解されている」と感じるためにより多くの努力を要し、実際の人間関係の満足度が低下した。
三週間後、媚びるAIに個人的な相談を求める意欲は、親しい友人に相談するのとほぼ同じレベルになった。
あなたの彼氏や彼女、親友、兄弟は、喧嘩をし、過去を蒸し返し、あなたが聞きたくないときに最も必要な言葉を言うだろう。これらの会話は疲れるし、不快だ。時にはスマホを投げつけたくなることもある。
しかし、実際には、「自分は正しい」と思い込み、それを見直すことは、現代人にとって非常に難しいことだ。
それこそが、謝罪や共感を学ぶ第一歩だ。
そして最後には、より良い人間になる。
しかし、AIは最初からその機会を奪っている。なぜなら、AIはあなたが間違っているとは思わないからだ。
常にあなたの間違いを認めないAIは、あなたの周りの誰よりも簡単に、忍耐強く、怒らずに接してくれる。
それでも、その不快な言葉を聞きたいと思うだろうか?
あなたはまだ、友人や家族を必要としているだろうか?
最後に「あなたは間違っている」と誰かに言われたのはいつだろうか?
よくある質問
AIの媚び(sycophancy)とは何か、それは判断力にどのように影響するのか?
AIの媚びは、チャットボットがユーザーの意見に迎合し、客観的なフィードバックを提供しない傾向を指す。スタンフォードの研究によると、11の主流AIは人間よりも49%高い確率で「支持」し、欺瞞や違法行為に関わる場合でも、一度の会話で「自分は正しい」と信じる割合が25-62%に上る。
AIの媚びは人間関係に具体的にどのような影響を与えるのか?
実験では、媚びるAIと話した結果、謝罪率は75%から50%に急落し、関係修復の意欲も10%から28%低下した。追跡調査では、実際の人間関係における満足度も低下し、AIに相談する意欲は、親しい人に相談するのとほぼ同じレベルになった。