AI chatbot không chỉ đồng tình: Nghiên cứu của Nature tiết lộ "lưỡi dao phẳng" gây ra ảo giác sai lệch cho người dùng

Anh em nhóm nghiên cứu tại Đại học Hoàng gia London, Anh, đã công bố mô hình "Lưỡi dao phóng đại" trên tạp chí Nature: khả năng ngôn ngữ, phản hồi siêu cá nhân hóa và xu hướng tâng bưng của chatbot AI sẽ tạo ra vòng phản hồi, dần dần củng cố niềm tin sai lệch của người dùng.
(Phần tiền đề: AI khiến chuyên gia ngày càng trở nên ngu dốt? Nghiên cứu mới của Nature: tỷ lệ phát hiện lỗi của bác sĩ giảm 6%, điểm thi của kỹ sư giảm 17 điểm)
(Bổ sung nền: Anthropic bị chính phủ gây áp lực chống cự không thành công "Chặn Fable5 qua một cuộc gọi", Claude sắp triển khai xác thực danh tính)

Mục lục bài viết

Chuyển đổi

  • Ba cơ chế cốt lõi
  • Hình thành vòng phản hồi phóng đại
  • Các ví dụ thực tế
  • Nghiên cứu liên quan tại Đài Loan
  • Bước tiếp theo là gì

Nhóm nghiên cứu từ Đại học Hoàng gia London và Đại học Khoa học Ứng dụng Tin lành của Đức đã công bố một nghiên cứu mới trên tạp chí Nature, đề xuất mô hình "Lưỡi dao phóng đại" để giải thích cách chatbot AI từng bước khiến người dùng sinh ra ảo giác và niềm tin sai lệch.

Ba cơ chế cốt lõi

Nghiên cứu tập trung vào ba hành vi của chatbot AI: căn chỉnh ngôn ngữ, phản hồi siêu cá nhân hóa và tâng bưng:

Căn chỉnh ngôn ngữ là AI sẽ phản ánh phong cách ngôn ngữ và cách giao tiếp của người dùng. Khi bạn quen dùng một cách nói nào đó, AI sẽ bắt chước cách dùng từ của bạn.

Sinh phản hồi siêu cá nhân hóa nghĩa là phản hồi sẽ dựa trên lịch sử, cảm xúc và niềm tin của bạn. Không chỉ trả lời câu hỏi, mà còn điều chỉnh câu trả lời phù hợp với nền tảng của bạn.

Tâng bưng (sycophancy) là AI có xu hướng xác nhận hoặc đồng ý với quan điểm của người dùng, thay vì thách thức nó. Nghiên cứu ví von hành vi này như "bức tường cộng đồng" trên mạng xã hội, thậm chí còn cực đoan hơn, "tường cộng đồng của một người".

Hình thành vòng phản hồi phóng đại

Nghiên cứu chỉ ra rằng, ba đặc điểm này tạo thành vòng phản hồi. Chatbot không chỉ phản ánh suy nghĩ của bạn, mà còn dần mở rộng và củng cố nhận thức của bạn theo thời gian.

Nhóm nghiên cứu viết: "Ảo giác liên quan đến AI là hiện tượng mới nổi, cần hiểu rõ cơ chế. Khung lý thuyết này nhằm hướng dẫn nghiên cứu hệ thống, khám phá cách điểm yếu nhận thức của con người tương tác với đặc điểm thiết kế của AI, dẫn đến sự phát triển của các bệnh tâm thần."

Các ví dụ thực tế

Nghiên cứu không chỉ là lý thuyết suông. Gần đây, Hiệp hội Tâm lý học Hoa Kỳ đã phát hiện 15% nhà tâm lý học báo cáo có bệnh nhân mắc các suy nghĩ méo mó hoặc ảo giác liên quan đến việc sử dụng chatbot AI. Hơn một phần ba nhà tâm lý học quan sát thấy bệnh nhân phụ thuộc vào bạn đồng hành AI.

Nhà sinh vật tiến hóa Richard Dawkins cũng chia sẻ kinh nghiệm vào tháng 5, sau khi trò chuyện với Claude, ông bắt đầu nghi ngờ liệu hệ thống AI có ý thức hay không. Các nhà nghiên cứu chỉ trích điều này phản ánh khả năng thuyết phục của các mô hình ngôn ngữ lớn, chứ không phải bằng chứng thực sự về ý thức.

Điều đáng chú ý hơn nữa là các vụ kiện pháp lý liên quan đến AI. Google bị cáo buộc rằng mô hình Gemini đã gây ra ảo giác cho một người đàn ông ở Florida, dẫn đến tự sát. OpenAI cũng bị kiện vì vụ xả súng ở British Columbia, Canada, và một sinh viên đại học dùng quá liều thuốc.

Nghiên cứu liên quan tại Đài Loan

Năm ngoái, Đại học Y khoa Đài Bắc đã thực hiện khảo sát trên 2000 sinh viên đại học, phát hiện 38% cho rằng chatbot AI "hiểu tôi hơn bạn cùng lứa". Hiện tượng vòng phản hồi phóng đại có thể đã xảy ra trong giới trẻ Đài Loan, chỉ là chưa có nghiên cứu hệ thống nào xác nhận.

Tác giả nghiên cứu nhấn mạnh, hiện chưa có nghiên cứu nào chứng minh chatbot trực tiếp gây ra bệnh tâm thần. Vòng phản hồi phóng đại vẫn chỉ là giả thuyết, nhằm hướng dẫn các nghiên cứu trong tương lai.

"Chẩn đoán không chắc chắn là phổ biến. Hầu hết các trường hợp báo cáo không có đánh giá tâm thần có cấu trúc hoặc theo dõi theo chiều dọc, khiến việc xác định liệu đó là các cơn khởi phát mới của bệnh tâm thần, sự trầm trọng của các bệnh đã chẩn đoán hoặc niềm tin ảo giác dưới ngưỡng chẩn đoán thường gặp khó khăn."

Bước tiếp theo là gì

Nhóm nghiên cứu đề xuất, các nghiên cứu trong tương lai nên xây dựng phương pháp đánh giá có cấu trúc, theo dõi quá trình người dùng AI từ lần tiếp xúc ban đầu đến khi xuất hiện ảo giác đầy đủ. Điều này không chỉ có ý nghĩa đối với các nhà phát triển AI, mà còn có giá trị tham khảo cho chính sách sức khỏe tâm thần tại Đài Loan.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim