Ontology yêu cầu xác minh con người trong dữ liệu đào tạo AI mà không hy sinh quyền riêng tư

Ontology đang nhấn mạnh một vấn đề ngày càng trở nên nghiêm trọng trong thế giới AI: làm thế nào để chứng minh rằng một dữ liệu đào tạo đến từ một người thật mà không biến toàn bộ quá trình thành cơn ác mộng về quyền riêng tư?

Trong một bài đăng gần đây, dự án lập luận rằng câu trả lời không nên là tăng cường giám sát. Thay vì yêu cầu các cộng tác viên cung cấp ảnh tự chụp, giấy tờ tùy thân, quét sinh trắc học và các chi tiết cá nhân khác, Ontology cho rằng ngành công nghiệp nên dựa vào chứng thực có thể xác minh và tiết lộ có chọn lọc để mọi người có thể chứng minh họ là con người mà không tiết lộ tất cả về bản thân.

Ý tưởng đó quan trọng hơn bây giờ so với một năm trước. Cuộc trò chuyện về dữ liệu đào tạo AI rõ ràng đã chuyển hướng. Trước đây chủ yếu xoay quanh quy mô, khối lượng và lượng dữ liệu có thể thu thập được. Giờ đây câu hỏi lớn hơn là dữ liệu đó đến từ đâu, liệu có thực sự do con người tạo ra hay không, và bao nhiêu phần trong số đó đã bị ô nhiễm bởi nội dung tổng hợp.

Mối quan tâm đó không còn là vấn đề nhỏ nữa. Nó đã trở thành một trong những rắc rối lớn nhất mà các nhóm AI phải đối mặt khi cố gắng xây dựng các mô hình sạch hơn, đáng tin cậy hơn. Ontology cho rằng thị trường đã bắt đầu xem chứng minh quyền con người như một tài sản quý giá. Dữ liệu con người đã được xác thực đang trở thành thứ mà các công ty có thể phải trả thêm phí để có được.

Nhu cầu đang tăng lên, nhưng nguồn cung lại hạn chế, và cách nhiều nền tảng dự định xác minh người dùng, theo quan điểm của công ty, là rất thiếu sót. Con đường dễ nhất cho hầu hết các nền tảng cũng chính là con đường xâm phạm nhất.

Nếu họ muốn biết ai đó có phải là con người hay không, họ thường yêu cầu nhiều hơn nữa thông tin cá nhân. Họ có thể yêu cầu một ảnh tự chụp, giấy tờ tùy thân của chính phủ, kiểm tra sự sống, theo dõi hành vi, nhận dạng thiết bị hoặc một sự kết hợp của tất cả các yếu tố đó.

Mỗi lớp có thể làm tăng độ tin cậy của việc xác minh, nhưng cũng đồng nghĩa với việc người dùng phải từ bỏ nhiều quyền riêng tư hơn. Theo thời gian, người cố gắng chứng minh mình là thật sẽ bị phân rã thành một tập hợp các điểm dữ liệu được lưu trữ trên hệ thống của người khác. Ontology lập luận rằng đây là sự đánh đổi sai lầm.

Công ty cho rằng vấn đề không phải là người ta cần phải được xác minh. Vấn đề là mô hình hiện tại giả định rằng việc xác minh phải đi kèm với việc phơi bày vĩnh viễn. Đó chính là hậu quả khi ngành công nghiệp sử dụng các công cụ tập trung được thiết kế để thu thập càng nhiều dữ liệu càng tốt. Trong thực tế, con người trở thành chi phí của sự tin tưởng.

Bước đột phá thực sự

Lựa chọn thay thế mà Ontology hướng tới dựa trên Mô hình Dữ liệu Chứng thực Có thể xác minh của W3C 2.0, được công bố như một Khuyến nghị vào tháng 5 năm 2025. Ý tưởng khá đơn giản, ngay cả khi mã hóa phía sau nó không phải là: một nhà phát hành đáng tin cậy, chẳng hạn như chính phủ, ngân hàng hoặc nhà cung cấp xác thực, có thể xác nhận điều gì đó về một người một lần, và chứng chỉ đó có thể tồn tại trên thiết bị của người dùng.

Khi một nền tảng sau này cần biết liệu người đó có phải là con người hay không, người dùng có thể trình bày một bằng chứng mã hóa thay vì cung cấp toàn bộ hồ sơ gốc. Điều đó có nghĩa là người xác minh nhận được những gì cần thiết, và không nhiều hơn.

Nó biết rằng một nhà phát hành đáng tin cậy đã xác nhận rằng người đó là con người. Nó không thấy toàn bộ hồ sơ danh tính của người đó, dữ liệu sinh trắc học hoặc các chi tiết bổ sung khác. Nhà phát hành không cần liên hệ mỗi lần chứng chỉ được sử dụng, và người dùng không để lại dấu vết các định danh liên kết trên các nền tảng khác nhau.

Ontology nói rằng bước đột phá thực sự ở đây là tiết lộ có chọn lọc. Đó chính là điều làm cho hệ thống thực sự bảo vệ quyền riêng tư. Một chứng chỉ có thể chứa nhiều thông tin, nhưng người dùng chỉ tiết lộ những phần quan trọng cho yêu cầu cụ thể đó. Vì vậy, nếu một nền tảng chỉ cần chứng minh quyền con người, nó sẽ nhận đúng như vậy và không gì khác.

Không có dữ liệu cá nhân bổ sung, không sinh trắc học, không các phần hồ sơ có thể tái sử dụng sau này để ghép nối. Công ty cũng đã chỉ ra công việc của chính mình trong lĩnh vực danh tính phi tập trung, bao gồm ONT ID và ví ONTO, như những ví dụ về cách tiếp cận này trong thực tế.

Theo Ontology, các công cụ này được thiết kế để giữ chứng chỉ trên thiết bị và cho phép người dùng tạo chứng minh tại chỗ, mà không tiết lộ dữ liệu riêng tư của họ cho nhà phát hành hoặc người xác minh. Tuy nhiên, điểm lớn hơn không chỉ là về Ontology. Nó còn về hướng đi của hạ tầng AI trong tương lai.

Khi các công ty cạnh tranh để làm sạch dữ liệu đào tạo của họ và xác định những gì vẫn có thể tin tưởng, áp lực xác minh các cộng tác viên con người sẽ chỉ ngày càng tăng. Câu hỏi thực sự là liệu ngành công nghiệp có giải quyết vấn đề đó bằng cách xây dựng thêm giám sát vào hệ thống hay bằng cách sử dụng các hệ thống cho phép mọi người chứng minh họ là thật mà không từ bỏ quyền riêng tư của mình trong quá trình đó.

Ontology rõ ràng đang đặt cược vào phương án thứ hai. Và với các công ty AI giờ đây lo lắng nhiều hơn về nguồn gốc dữ liệu hơn là về số lượng thô, thì cược đó có thể bắt đầu trông ít như một tranh luận về quyền riêng tư nhỏ lẻ và nhiều hơn như một yêu cầu thực tế cho giai đoạn tiếp theo của việc thu thập dữ liệu AI.

ONT4,56%
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim