Đang đến rồi sao? Kính thông minh Meta đã chuẩn bị chức năng "nhận diện khuôn mặt": Ba mô hình AI + cơ sở dữ liệu đặc điểm sinh học

Một nhà nghiên cứu an ninh mạng đã phân tích ứng dụng điện thoại của Meta Smart Glasses và phát hiện: nó đã tích hợp đầy đủ hệ thống nhận diện khuôn mặt trên thiết bị, gồm ba mô hình AI, cơ sở dữ liệu sinh trắc học cục bộ, chỉ mục vector cosine similarity, cùng một thông báo "Person recognized". Hệ thống này có thể chạy thủ công, nhưng Meta vẫn chưa kích hoạt cho người tiêu dùng.
(Trước đó: Amazon, Meta và FBI đều có thể truy cập một mạng chia sẻ tình báo không công khai: Cách Seattle Shield hình thành thời đại giám sát AI lớn)
(Bổ sung bối cảnh: Google hợp tác với Samsung ra mắt kính thông minh mới: Audio glasses dự kiến ra mắt mùa thu này, thách thức hơn 70% thị phần của Meta)

Mục lục bài viết

Chuyển đổi

  • Ba mô hình, một dòng pipeline, 96 MB engine nhận diện khuôn mặt
  • Khuôn mặt chưa đặt tên: cơ sở dữ liệu cục bộ và thư mục lưu trữ quyền 0700
  • Dự kiến ra mắt cuối năm nay

Một hệ thống có thể nhận diện danh tính người lạ đã hoàn thiện, nằm trong ứng dụng điện thoại của Meta Smart Glasses: ba mô hình AI, khoảng 100 MB, gồm 2048 số tạo thành dấu vân tay khuôn mặt, cộng thêm một thông báo "Person recognized". Đây là phát hiện mới nhất sau khi nhà nghiên cứu an ninh mạng phân tích.

Ứng dụng đi kèm Meta Smart Glasses có tên Stella, phiên bản nhà nghiên cứu phân tích là v273.0.0.21. Trong đó, ông tìm thấy không phải vài dòng mã thử nghiệm, mà là một pipeline nhận diện khuôn mặt hoàn chỉnh, có thể chạy thủ công, từ phát hiện khuôn mặt, căn chỉnh, tạo đặc trưng sinh trắc, đến truy vấn cơ sở dữ liệu cục bộ, kích hoạt thông báo hệ thống ưu tiên cao, tất cả đều đã kết nối liền mạch.

Ba mô hình, một pipeline, engine vân tay khuôn mặt 96 MB

Ứng dụng Stella tích hợp ba mô hình ExecuTorch, được tải xuống từ hệ thống phân phối tài sản NMLML của Meta, tổng khoảng 100 MB. Ba mô hình này đảm nhiệm các chức năng riêng, theo thứ tự tạo thành một pipeline:

Đầu tiên là SCRFD.pte (3.4 MB): chịu trách nhiệm phát hiện khuôn mặt trong hình ảnh.

Thứ hai là KPSAligner.pte (117 KB): cắt và căn chỉnh khuôn mặt đã phát hiện, để mỗi khuôn mặt đều cùng một chuẩn.

Thứ ba, cũng là lớn nhất, là SFace.pte (96 MB): chuyển đổi khuôn mặt đã căn chỉnh thành 2048 số thực, gọi là "vân tay khuôn mặt" hoặc dấu vân sinh trắc. Nói đơn giản, 2048 số này chính là tọa độ của khuôn mặt trong không gian toán học, hai ảnh chụp cùng một người dưới ánh sáng, góc độ khác nhau, khi chuyển thành vector sẽ có tọa độ gần nhau; còn của người khác thì cách xa.

Nhà nghiên cứu đã thử nghiệm pipeline này: gọi trực tiếp handler của ứng dụng, đưa vào ảnh của triết gia Michel Foucault công khai. Kết quả là toàn bộ pipeline chạy trơn tru, phát hiện khuôn mặt, tạo vân tay 2048 chiều, truy vấn chỉ mục vector cục bộ, rồi sau đó kích hoạt thông báo Android ưu tiên cao, tiêu đề "Person recognized", nội dung "Recognized Michel Foucault".

Khuôn mặt chưa đặt tên: cơ sở dữ liệu cục bộ và thư mục lưu trữ quyền 0700

Ứng dụng tạo ra một cơ sở dữ liệu SQLite trên thiết bị, nằm trong khung đồng bộ đa thiết bị của Meta là RLDrive, tên không gian là person_profiles, thiết kế để có thể điền dữ liệu từ xa (máy chủ). Nói cách khác, cơ sở dữ liệu này không chỉ là cục bộ, mà còn dự phòng giao diện đẩy dữ liệu liên lạc từ đám mây Meta.

Cấu trúc dữ liệu gồm bảng person, bảng face, và một bảng vector ảo. Logic nhận diện là: thực hiện truy vấn cosine similarity trên chỉ mục vector này, tức là tính "tọa độ của khuôn mặt mới" và "khuôn mặt trong cơ sở dữ liệu gần nhất", rồi kết hợp với person.name để hiển thị thông báo.

Dự kiến ra mắt cuối năm nay

Meta chiếm hơn 70% thị phần kính thông minh, và theo báo New York Times đầu tháng 2 năm 2026, Meta đang xem xét thêm chức năng nhận diện khuôn mặt cho kính thông minh, mục tiêu ra mắt cuối năm. TechCrunch cũng có bài viết liên quan. Cuộc điều tra này cung cấp bằng chứng kỹ thuật cụ thể cho các báo cáo đó.

Tuy nhiên, nhà nghiên cứu cũng nhấn mạnh rằng, hiện tại, các giao diện người dùng dành cho người dùng chưa xuất hiện trên thiết bị chính hãng, chức năng chưa được kích hoạt. Ông nhấn mạnh: "Đây không phải Meta đang âm thầm nhận diện người bạn thấy. Mà: toàn bộ hệ thống thiết bị để làm việc đó đã hoàn thiện, có thể vận hành, nằm sẵn trên thiết bị của bạn, do Meta kiểm soát."

Hiện tại, thời điểm kích hoạt hay có kích hoạt hay không là quyết định của Meta. Chỉ cần một công tắc để bật hoặc tắt.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim