AI khiến chuyên gia ngày càng trở nên ngu dốt? Nghiên cứu mới nhất của Nature: tỷ lệ phát hiện lỗi của bác sĩ giảm 6%, kỹ sư thi thử giảm 17 điểm

Bệnh viện nội soi đại tràng tại Ba Lan cho thấy, sau khi bác sĩ bắt đầu sử dụng AI hỗ trợ, tỷ lệ phát hiện u tuyến giảm từ 28.4% xuống còn 22.4% khi tắt AI; thử nghiệm ngẫu nhiên đối chứng của Anthropic với 52 kỹ sư cấp thấp cho thấy, nhóm AI trung bình đạt 50 điểm trong bài kiểm tra sau, nhóm thủ công 67 điểm, chênh lệch tương đương hai cấp độ chữ cái.
(Thông tin trước: Nghiên cứu của Anthropic: Chuyên môn lĩnh vực quan trọng hơn khả năng lập trình để quyết định hiệu quả tạo mã của Claude Code)
(Thông tin bổ sung: Claude có 80% mã do chính nó viết, Anthropic kêu gọi "các cơ chế thiết kế dừng toàn cầu" có thật không?)

Mục lục bài viết

Chuyển đổi

  • Bác sĩ ngừng dùng AI, tỷ lệ phát hiện giảm 6 điểm phần trăm
  • Thử nghiệm do chính Anthropic thực hiện, kết quả cũng không khả quan
  • Suy giảm kỹ năng không phải cảnh báo viễn tưởng, mà là hiện thực đang diễn ra

Sau khi bác sĩ sử dụng AI, khi không có AI hỗ trợ, họ bỏ lỡ nhiều khối u hơn. Các kỹ sư dùng AI, sau đó thi lại, điểm thấp hơn 17 điểm. Hai con số này đến từ hai nghiên cứu đồng nghiệp công bố năm 2026, được tạp chí Nature tổng hợp ngày 21 tháng 6.

Kết luận cho thấy, công cụ AI trong việc nâng cao hiệu quả ngắn hạn đang hệ thống hóa xói mòn năng lực cốt lõi của con người. Nhà nghiên cứu y khoa tại Đại học Oslo, Yuichi Mori, trực tiếp nói: "Hiện chưa có giải pháp nào được xác lập để chống lại suy giảm kỹ năng, đây có thể là vấn đề nghiên cứu nóng nhất trong mười năm tới."

Sau khi bác sĩ ngừng dùng AI, tỷ lệ phát hiện giảm 6 điểm phần trăm

Thử nghiệm ACCEPT của Ba Lan chọn một đối tượng nghiên cứu khá nghiêm ngặt: tất cả các bác sĩ tham gia đều đã thực hiện ít nhất 2.000 lần nội soi đại tràng, là bác sĩ chuyên khoa có kinh nghiệm lâm sàng đầy đủ, không phải thực tập sinh. Thiết kế nghiên cứu cho phép bác sĩ trong một số ngày khám bệnh có thể dùng công cụ hỗ trợ AI, hệ thống phân tích hình ảnh ruột ngay lập tức, tự động đánh dấu các khả năng u tuyến, còn những ngày khác thì hoàn toàn không thể dùng. Kết quả đăng trên Tạp chí Khoa học Gan mật và Tiêu hóa.

Trước khi có AI, tỷ lệ phát hiện u tuyến của nhóm bác sĩ này là 28.4%. Sau khi có AI, trong các buổi không có AI hỗ trợ, tỷ lệ phát hiện giảm còn 22.4%, giảm đúng 6 điểm phần trăm.

Nghiên cứu chỉ ra, việc liên tục sử dụng công cụ AI khiến các bác sĩ lâm sàng "khi không có AI hỗ trợ, sẽ trở nên ít chủ động hơn, ít tập trung hơn, và kết quả cũng kém trách nhiệm hơn". Nhận xét của bác sĩ Robert Wachter, Đại học California, San Francisco, còn thẳng thắn hơn: ngay cả những chuyên gia có kỹ năng cao cũng có thể dần tiến bộ chậm lại trong công việc do phụ thuộc vào công cụ AI.

Cơ chế này không khó hiểu. Khi AI đảm nhận việc "tìm bất thường" trong thời gian dài, cách phân bổ chú ý của bác sĩ sẽ bị huấn luyện lại; khi hệ thống hỗ trợ rút đi, bộ não đã quen với việc "đợi AI báo cáo" sẽ rất khó tự động chuyển sang trạng thái cảnh giác cao độ.

Thử nghiệm của Anthropic do chính họ thực hiện, kết quả cũng không khả quan

Các nhà nghiên cứu của Anthropic, Judy Hanwen Shen và Alex Tamkin, công bố ngày 29 tháng 1 năm 2026, một thử nghiệm ngẫu nhiên đối chứng. Đối tượng là 52 kỹ sư phần mềm cấp thấp, tất cả đều được yêu cầu học một thư viện Python mới tên là Trio. Tất cả đều có thể tra cứu tài liệu hướng dẫn chính thức trực tuyến; một nửa trong số họ còn được trang bị trợ lý AI.

Nhóm AI trung bình đạt 50%, nhóm mã thủ công 67%, chênh lệch 17 điểm phần trăm, tương đương hai cấp độ chữ cái trong xếp loại học tập. Hiệu quả thời gian thế nào? Nhóm AI hoàn thành nhiệm vụ trung bình nhanh hơn khoảng 2 phút, không đạt ý nghĩa thống kê. Nói cách khác, kỹ sư đổi lại bằng: mất đi 17 điểm về độ hiểu biết, đổi lấy 2 phút tốc độ bề mặt.

Suy giảm nghiêm trọng nhất là khả năng sửa lỗi. Shen và Tamkin đặc biệt nhấn mạnh điểm nguy hiểm này, việc phát hiện lỗi do AI sinh ra vẫn là một trong những chức năng giám sát quan trọng nhất của con người. Nếu khả năng sửa lỗi của kỹ sư bị teo tóp do phụ thuộc lâu dài vào AI, thì lỗi của AI sẽ khó phát hiện hơn, tạo thành một vòng lặp tự làm xấu đi.

Thử nghiệm còn tiết lộ một chi tiết: kỹ sư dùng AI để "khám phá khái niệm" cuối cùng đạt điểm trên 65%; còn kỹ sư hoàn toàn giao phó "tạo mã" cho AI thì điểm dưới 40%. AI là công cụ khám phá hay là thay thế sản xuất, kết quả chênh lệch 25 điểm phần trăm.

Suy giảm kỹ năng không phải cảnh báo viễn tưởng, mà là hiện thực đang diễn ra

Hai nghiên cứu này không hỏi "AI có hữu ích không", mà là "người dùng AI lâu dài, khi không có AI, còn lại bao nhiêu năng lực". Câu trả lời bắt đầu xuất hiện trong dữ liệu có thể đo lường được.

Hiện tại, giới học thuật gần như chưa có đồng thuận về "tần suất tối ưu sử dụng AI", cũng như chưa có biện pháp can thiệp đã được xác nhận để duy trì kỹ năng cốt lõi trong môi trường AI. Mori nói, đây sẽ là vấn đề nghiên cứu nóng nhất trong mười năm tới, và hiện nay không quá lời, vì tốc độ suy giảm kỹ năng có thể nhanh hơn tốc độ nghiên cứu theo kịp.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim