Không nhiều nền tảng mã nguồn mở thuật toán của họ.


Nhưng X thì có, và vì chúng ta đều ở đây, tôi nghĩ sẽ đăng về cách hoạt động của nguồn cấp dữ liệu Dành Cho Bạn ↓
1. X trộn các bài đăng từ những người bạn theo dõi với các bài đăng từ các tài khoản bạn không theo dõi.
2. Sau đó nó xếp hạng chúng dựa trên những gì nó nghĩ bạn sẽ quan tâm.
3. Quy trình khá đơn giản:
hoạt động của bạn → các bài đăng có thể → bộ lọc → dự đoán tương tác → nguồn cấp cuối cùng
4. Có 2 nguồn chính:
→ Thunder: bài đăng từ những người bạn theo dõi
→ Phoenix: bài đăng từ mạng lưới X rộng hơn
5. Phoenix là phần giúp các bài đăng tiếp cận người mới.
Nếu X nghĩ bài đăng của bạn phù hợp với sở thích của ai đó, nó có thể hiển thị ngay cả khi họ không theo dõi bạn.
6. Thuật toán xem xét hành vi của bạn và tìm các bài đăng tương tự từ một kho dữ liệu lớn.
Sau đó nó xếp hạng chúng dựa trên khả năng bạn sẽ làm gì.
7. Nó dự đoán các yếu tố như:
thích, trả lời, chia sẻ lại, trích dẫn, nhấp, nhấp vào hồ sơ, xem video, phóng to ảnh, chia sẻ, thời gian ở lại, theo dõi, chặn, tắt tiếng, báo cáo, và “không quan tâm.”
8. Các tín hiệu tốt giúp ích. Các tín hiệu xấu gây hại.
→ Tốt: thích, trả lời, chia sẻ lại, chia sẻ, nhấp, theo dõi, thời gian ở lại
→ Xấu: chặn, tắt tiếng, báo cáo, “không quan tâm”
9. Trả lời rất quan trọng.
Nếu mọi người trả lời bài đăng của bạn, đó là dấu hiệu mạnh mẽ cho thấy bài đăng bắt đầu một cuộc trò chuyện thực sự.
10. Thời gian ở lại cũng quan trọng.
X không chỉ quan tâm nếu ai đó thích bài đăng của bạn. Nó còn quan tâm nếu họ dừng lại và dành thời gian đọc.
11. Nhấp vào hồ sơ và theo dõi cũng quan trọng.
Một bài đăng khiến ai đó kiểm tra hồ sơ của bạn mạnh hơn nhiều so với một bài họ lướt qua.
12. Chia sẻ rất quan trọng.
Nếu mọi người gửi bài của bạn cho người khác, nhắn tin trực tiếp, hoặc sao chép liên kết, đó là tín hiệu mạnh.
13. Nguồn cấp dữ liệu được cá nhân hóa.
Trang Dành Cho Bạn của bạn dựa trên hành vi của chính bạn, không phải danh sách “bài đăng tốt nhất” chung chung.
14. Giữ đúng chủ đề giúp ích.
Nếu bạn đăng quanh một lĩnh vực rõ ràng, X dễ dàng hơn trong việc xác định ai nên xem nội dung của bạn.
15. X cũng cố gắng không hiển thị quá nhiều bài từ cùng một tài khoản liên tiếp.
Vì vậy, ngay cả các tài khoản tốt cũng được phân bổ đều.
16. Nhiều thứ bị lọc trước khi xếp hạng.
Trùng lặp, bài cũ, từ bị tắt tiếng, tài khoản bị chặn, bài đã xem, spam, nội dung bạo lực, máu me, v.v.
17. Kho mã nguồn công khai không phải là hệ thống hoạt động đầy đủ.
Nó hiển thị nhiều thứ, nhưng hệ thống sản xuất lớn hơn và được huấn luyện trên dữ liệu theo thời gian thực.
18. Trọng số chính xác không hoàn toàn công khai.
Chúng tôi biết X theo dõi các tín hiệu nào, nhưng X vẫn có thể điều chỉnh mức độ quan trọng của từng tín hiệu.
19. Thời điểm vẫn quan trọng.
Một bài đăng cần có tín hiệu sớm từ đúng người trước khi nó được đẩy rộng hơn.
20. Mục tiêu thực sự là huấn luyện thuật toán.
Mỗi bài đăng tốt đều dạy X biết nội dung của bạn dành cho ai.
Nếu cùng loại người đó tiếp tục đọc, trả lời, chia sẻ, nhấp, theo dõi, hệ thống sẽ ngày càng tốt hơn trong việc tìm kiếm nhiều người giống họ.
Vẫn khá ấn tượng khi họ mã nguồn mở nhiều như vậy.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim