Chú ý》Ảnh bạn chụp, lời bạn nói, Google bây giờ sẽ lưu lại để huấn luyện AI (cách tắt chức năng đào tạo)

Google tuyên bố sẽ hợp nhất hình ảnh Lens, ghi âm Search Live, âm thanh tìm kiếm bằng giọng nói và nhập khẩu dịch giọng nói vào cài đặt mới mang tên "Lịch sử Dịch vụ Tìm kiếm", và rõ ràng cho biết những dữ liệu này sẽ được sử dụng để cải thiện các mô hình AI của họ.
(Tiểu sử: Google Search có cuộc cách mạng lớn nhất trong lịch sử: định vị lại Search thành cổng vào AI tổng hợp một cửa)
(Bổ sung nền: Trình duyệt riêng tư Brave sắp "tự xây dựng công cụ tìm kiếm", CEO: muốn giúp người dùng thoát khỏi sự giám sát của Google)

Bạn quét một bức ảnh sản phẩm bằng Google Lens, nói câu hỏi đường đi qua điện thoại, hoặc nói ra một ngoại ngữ trong Google Dịch, những tương tác này sắp tới Google sẽ lưu trữ rõ ràng hơn và dùng để cải thiện các dịch vụ bao gồm cả mô hình AI.

Google đã thông báo trong email gửi đến người dùng ngày 10 tháng 6 rằng, sẽ lưu trữ hình ảnh, âm thanh và video phát sinh trong quá trình tìm kiếm vào một cài đặt mới mang tên "Lịch sử Dịch vụ Tìm kiếm".

Cài đặt mới này cùng với cài đặt mới khác là "Đề xuất cá nhân hóa" sẽ sớm tách ra khỏi tùy chọn "Hoạt động web & Ứng dụng" hiện tại trong vài tháng tới, để người dùng có thể quản lý riêng biệt. Trước khi tách ra, tất cả các ghi chú liên quan đến tương tác tìm kiếm đều nằm trong một công tắc tổng hợp, không thể kiểm soát riêng; sau khi tách, người dùng sẽ có quyền kiểm soát chi tiết hơn về dữ liệu của từng loại.

Những gì sẽ được lưu trữ

Theo giải thích chính thức của Google, các nội dung media được đưa vào Lịch sử Dịch vụ Tìm kiếm gồm bốn loại:

  • Hình ảnh bạn tải lên khi dùng Google Lens để tìm kiếm hình ảnh (Lens nhận diện các vật thể, cảnh vật hoặc chữ trong ảnh, và trả về kết quả tìm kiếm trực tiếp, là cổng tìm kiếm hình ảnh mà Google tích cực thúc đẩy);
  • Ghi âm của công cụ tìm kiếm trực tiếp Search Live (Search Live. Nói đơn giản là, bạn hướng camera về thế giới thực, để Google nhận diện và trả lời câu hỏi ngay lập tức);
  • Âm thanh của tìm kiếm bằng giọng nói thông thường;
  • Nhập khẩu giọng nói bạn nói ra trong Google Dịch。

Bốn loại dữ liệu này đều có điểm chung: chúng đều thuộc dạng dữ liệu đa mô thức. Hiện tại, các phòng thí nghiệm AI đang cạnh tranh để nâng cao khả năng cho mô hình có thể nhìn, nghe, và hiểu thế giới thực, và điều này đòi hỏi lượng lớn dữ liệu tương tác thị giác và âm thanh của người dùng thật làm dữ liệu huấn luyện. Với hàng tỷ hành vi tìm kiếm hàng ngày của người dùng, quy mô và đa dạng của dữ liệu này là lợi thế khó sao chép của bất kỳ đối thủ nào.

Các ghi chú này trước đây đã từng được thu thập, nhưng giờ đây Google lần đầu tiên tách rõ "media" ra thành một loại riêng biệt để xử lý. Lý do được ghi rõ trong điều khoản chính thức: Google sẽ sử dụng những dữ liệu này để "cung cấp, phát triển và cải thiện dịch vụ", trong đó có cả mô hình AI của họ.

Phạm vi của cài đặt mới không chỉ bao gồm Google Search, mà còn mở rộng đến Maps, Shopping, Hotels, Flights, Dịch, Tin tức và tất cả các dịch vụ tìm kiếm khác của Google. Nói cách khác, chỉ cần bạn từng tương tác bằng giọng nói hoặc hình ảnh trong hệ sinh thái ứng dụng của Google, về lý thuyết đều nằm trong phạm vi thu thập của cài đặt mới này.

Điều đáng chú ý là, nếu bật "Đề xuất cá nhân hóa", những dữ liệu này còn được dùng để cá nhân hóa đề xuất và quảng cáo. Hai mục này diễn ra đồng thời: dữ liệu huấn luyện AI và tối ưu hóa quảng cáo đều dựa trên cùng một tập ghi nhận của bạn. Một câu hỏi đường của bạn có thể trở thành mẫu âm học cho mô hình, hoặc là căn cứ để hệ thống quảng cáo suy đoán vị trí và nhu cầu của bạn.

Cách tắt? Chìa khóa là công tắc Save Media

Nếu bạn không muốn Google lưu trữ các tương tác media này, các bước thao tác như sau:

  1. Vào "Hoạt động của tôi trên Google"
  2. Chọn Lịch sử Dịch vụ Tìm kiếm
  3. Tắt tùy chọn Save Media trong đó. Nói cách khác, đó là công tắc tổng quyết định Google có thể lưu giữ hình ảnh, ghi âm, video của bạn hay không. Tắt nó đi, Google sẽ không còn lưu trữ các tương tác media này nữa.

Cài đặt này dự kiến sẽ được triển khai dần dần trong "vài tháng tới", hiện chưa phải tất cả tài khoản đều có thể truy cập. Khi chính thức ra mắt, Google cam kết sẽ thông báo cho người dùng và giữ nguyên các tùy chọn ưu tiên của họ.

Dữ liệu là nhiên liệu của AI, điều này không ai phủ nhận. Nhưng nguồn nhiên liệu đó chính là mỗi người dùng bình thường khi tra đường, chụp ảnh tìm kiếm, hoặc hỏi bằng giọng nói. Việc đổi chác này có công bằng hay không, đáng để mỗi người trước khi nhấn "Tiếp tục sử dụng" hãy suy nghĩ kỹ.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim