Resident Evil Star Phát Triển Hệ Thống Nhớ AI với Claude, Đạt Điểm Tuyệt Đối trên Chuẩn Đánh Giá LongMemEval

Theo 1M AI News, nữ diễn viên Hollywood Milla Jovovich (được biết đến với các vai diễn trong ‘The Fifth Element’ và series ‘Resident Evil’) đã đồng phát triển một hệ thống trí nhớ AI mã nguồn mở có tên MemPalace cùng với doanh nhân Bitcoin và người sáng lập nền tảng cho vay phi tập trung Libre, Ben Sigman. Được phát hành theo giấy phép MIT trên GitHub, dự án đã thu hút 5.500 lượt sao (stars) trong vòng ba ngày. Sigman cho biết hai người đã dành hàng tháng để phát triển dự án bằng Claude của Anthropic, với Claude Opus 4.6 được liệt kê là đồng tác giả trong lịch sử commit của Git. Lợi thế cạnh tranh cốt lõi của MemPalace nằm ở hiệu suất theo chuẩn benchmark. Trên benchmark truy xuất trí nhớ tiêu chuẩn LongMemEval, dự án đạt Recall@5 là 96,6% với truy xuất cục bộ thuần túy (không gọi bất kỳ API bên ngoài nào), và sau khi bật tính năng sắp xếp lại theo mô hình tùy chọn Haiku, dự án đạt điểm tuyệt đối 500 trên 500 câu hỏi—điều mà nhóm dự án khẳng định là điểm cao nhất từng được ghi nhận trên benchmark này, cho dù là sản phẩm miễn phí hay trả phí. Trên hai benchmark khác, ConvoMem đạt 92,9%, tuyên bố vượt sản phẩm trí nhớ AI Mem0 hơn gấp đôi; LoCoMo đạt điểm tuyệt đối trên tất cả các hạng mục suy luận đa chặng. Mã kiểm thử benchmark đã được công khai cùng với kho lưu trữ để đảm bảo khả năng tái lập. Không giống các giải pháp cơ sở dữ liệu vector phổ biến, MemPalace tổ chức thông tin bằng kỹ thuật “memory palace” (cung điện trí nhớ) của nhà hùng biện cổ Hy Lạp. Hệ thống sắp xếp hồ sơ hội thoại của người dùng thành một hệ phân cấp bốn tầng: Wing (chia theo người hoặc dự án) → Room (chủ đề cụ thể) → Closet (các bản tóm tắt được nén) → Drawer (các bản ghi hội thoại nguyên văn), với các phòng liên quan trong cùng một wing được liên kết qua “Halls” và được đối chiếu giữa các wing khác nhau thông qua “Tunnels.” Thử nghiệm của nhóm dự án cho thấy riêng cấu trúc này có thể cải thiện độ chính xác truy xuất lên 34%. Dự án cũng tạo ra một phương ngữ nén không mất mát tên AAAK, được thiết kế riêng cho tác nhân AI, giúp nén ngữ cảnh người dùng từ hàng nghìn token xuống khoảng 120 token, đạt tỷ lệ nén xấp xỉ 30 lần. AAAK bao gồm văn bản thuần túy được cấu trúc, không cần bộ giải mã đặc biệt hay tinh chỉnh, và có thể được hiểu trực tiếp bởi mọi mô hình ngôn ngữ lớn có khả năng đọc văn bản. Hệ thống còn tích hợp sẵn chức năng phát hiện mâu thuẫn, có thể nắm bắt sự không nhất quán về tên, đại từ, tuổi và nhiều hơn nữa trước khi đưa ra đầu ra. Toàn bộ hệ thống chạy cục bộ, không phụ thuộc dịch vụ đám mây, không cần khóa API và hoàn toàn miễn phí. Hệ thống hỗ trợ tích hợp với các công cụ như Claude, ChatGPT và Cursor thông qua giao thức MCP (cung cấp 19 công cụ MCP) và cũng hỗ trợ tạo các bản tóm tắt ngữ cảnh thông qua dòng lệnh cho các mô hình cục bộ như Llama và Mistral. Việc Jovovich “bước ngang” sang thế giới công nghệ đã khiến nhiều người bất ngờ. Kho lưu trữ dự án được đăng ký dưới tài khoản GitHub của cô, với 4 trong số 7 commit do cô thực hiện, bao gồm commit khởi tạo chứa toàn bộ mã nguồn cốt lõi. Cô đã đăng một video giới thiệu về dự án trên Instagram.

BTC3,96%
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim