Báo cáo: Vấn đề an ninh trở thành rào cản hàng đầu trong triển khai AI quy mô lớn, cần "dùng AI chống lại AI".

Ngày 23 tháng 6, tại Hội chợ Triển lãm Chuỗi Cung ứng Quốc tế Trung Quốc lần thứ 4, ông Lý Duệ, đối tác tư vấn quản lý Trung Quốc của PwC, đã công bố báo cáo "Từ đầu độc dữ liệu đến vượt ngục mô hình, tái cấu trúc hệ thống an ninh để phòng ngừa rủi ro AI mới" (sau đây gọi tắt là "báo cáo"), kết hợp với việc ứng dụng quy mô lớn của trí tuệ nhân tạo, phân tích sâu về ô nhiễm dữ liệu, chiếm đoạt lời nhắc, vượt ngục mô hình và các rủi ro an ninh mới khác.

"Kể từ năm 2021, số lượng sự cố và tác hại liên quan đến AI đã tăng theo cấp số nhân." Ông Lý Duệ thẳng thắn cho biết, vấn đề an toàn và rủi ro đã trở thành rào cản đầu tiên đối với việc triển khai quy mô lớn của AI tác nhân. Gần 2/3 số người được hỏi coi vấn đề an toàn và rủi ro là rào cản chính để mở rộng hoàn toàn ứng dụng AI tác nhân, tỷ lệ này cao hơn đáng kể so với sự không chắc chắn về quy định hoặc hạn chế kỹ thuật, cho thấy các tổ chức phải đối mặt nhiều hơn với những hạn chế về niềm tin vào khả năng triển khai an toàn các hệ thống tự chủ ở quy mô lớn.

Báo cáo cho thấy, dựa trên phân tích các sự cố rủi ro AI trong quá khứ, hơn một nửa số sự cố rủi ro AI bắt nguồn từ hành vi có chủ đích xấu của con người, các vấn đề an toàn và trục trặc của bản thân hệ thống AI chỉ chiếm 21%, và tỷ lệ này trong những năm gần đây vẫn đang giảm tương đối. Trong số liệu một năm 2025, tỷ lệ các sự cố thuộc loại tác nhân xấu đã tăng vọt từ 37,9% lên 57%, cho thấy AI đang ngày càng được vũ khí hóa nhanh chóng.

Báo cáo liệt kê các rủi ro AI hiện tại: Một, hacker AI nâng cấp, khai thác lỗ hổng thông minh, tự động phát tán mã độc; Hai, tấn công chính xác cao cấp do AI điều khiển, tống tiền có mục tiêu hơn; Ba, nội dung giả mạo sâu tràn lan, sự kiện tấn công kỹ thuật xã hội cao cấp xảy ra thường xuyên; Bốn, vượt ngục mô hình kích hoạt đầu ra vi phạm, gây áp lực kép về danh tiếng và tuân thủ; Năm, đầu độc chuỗi cung ứng AI, lỗ hổng ẩn gây ra sự cố kinh doanh; Sáu, thiên vị thuật toán, phân biệt đối xử có hệ thống và bất công xã hội; Bảy, nguồn dữ liệu đào tạo AI không rõ ràng, gây ra vi phạm bản quyền; Tám, đánh giá sai của trí tuệ nhúng, gây ra tổn hại vật chất và cá nhân; Chín, chuỗi tác vụ Agent mất kiểm soát, quyết định theo tầng gây ra hậu quả không thể đảo ngược; Mười, quy định AI bắt buộc và phân mảnh, khó khăn trong tuân thủ đa miền.

Trong hầu hết các loại rủi ro, người được hỏi đều cho biết có khoảng cách rõ rệt giữa những rủi ro mà họ cho là quan trọng và những rủi ro thực tế đang được thực hiện các biện pháp giảm thiểu. Khoảng cách này đặc biệt rõ ràng trong các khía cạnh vi phạm sở hữu trí tuệ và quyền riêng tư cá nhân, cho thấy tốc độ nâng cao nhận thức về rủi ro đã vượt quá tốc độ triển khai xây dựng các biện pháp kiểm soát, quy trình và công cụ tương ứng, do đó khó có thể quản lý rủi ro kịp thời và hiệu quả.

Ông Lý Duệ chỉ ra rằng, đối kháng cấp máy gây ra "bất đối xứng tấn công-phòng thủ" nghiêm trọng, tấn công đã là tốc độ thông minh, nhưng phòng thủ lại phụ thuộc vào việc chặn thủ công, các biện pháp phòng thủ truyền thống trở nên vô hiệu, phải "dùng AI để chống lại AI", thực hiện phòng ngừa rủi ro từ cả hai đầu vào và đầu ra, đầu vào phải đánh giá xem có tín hiệu nguy hiểm không, đầu ra phải đánh giá xem có nội dung vi phạm không. "Triển khai phát hiện và ứng phó mối đe dọa do AI điều khiển, cách ly mạng và kiểm soát lưu lượng, phát hiện mã độc và phân tích hộp cát, đồng thời quản lý lỗ hổng và sửa chữa theo thời gian thực."

Dữ liệu cho thấy, tính đến tháng 4 năm 2026, hơn 75 quốc gia/khu vực trên thế giới đã ban hành các chiến lược, chính sách và quy định liên quan đến trí tuệ nhân tạo, đạo đức khoa học công nghệ, minh bạch và trách nhiệm giải trình, tuân thủ dữ liệu và bảo vệ quyền riêng tư vẫn là trọng tâm chính của quản lý toàn cầu.

(Biên tập: Văn Tĩnh)

Từ khóa:

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận