Gần đây tôi đang xem một bài nghiên cứu của a16z, trong đó có một phép ẩn dụ khá thú vị——LLM thực chất sống trong hiện tại vĩnh cửu, giống như nhân vật mất trí nhớ trong bộ phim "Memory Fragment". Sau khi huấn luyện xong thì bị đông cứng lại, thông tin mới không thể vào được, chỉ có thể dựa vào ghi chú trò chuyện, hệ thống truy xuất để ứng phó. Nhưng như vậy có đủ không?



Ngày càng nhiều nhà nghiên cứu cho rằng không đủ. Học theo ngữ cảnh thực sự hữu ích, nhưng về bản chất nó là truy xuất, không phải học. Hãy tưởng tượng một tủ hồ sơ vô hạn, có thể tra cứu mọi thứ, nhưng nó chưa từng bị ép phải hiểu, nén, hoặc nội hóa kiến thức mới thực sự. Đối với những vấn đề cần khám phá thật sự—như chứng minh toán học hoàn toàn mới, các kịch bản đối kháng, hoặc những kiến thức quá tiềm ẩn, không thể diễn đạt bằng ngôn ngữ—chỉ dựa vào truy xuất chắc chắn là không đủ.

Đây chính là lý do vì sao hướng nghiên cứu học liên tục ngày càng được quan tâm. Vấn đề cốt lõi rất đơn giản: **Nén dữ liệu xảy ra ở đâu?** Hiện tại hệ thống giao phó việc nén cho kỹ thuật gợi ý, pipeline RAG, vỏ bọc trí tuệ nhân tạo. Nhưng cơ chế làm cho LLM mạnh mẽ khi huấn luyện—nén có tổn thất, học tham số—lại bị tắt đi ngay tại thời điểm triển khai.

Giới nghiên cứu có thể chia thành ba hướng chính. Một là học theo ngữ cảnh, nhóm tập trung tối ưu hóa pipeline truy xuất, quản lý ngữ cảnh, kiến trúc đa trí tuệ nhân tạo. Đây là hướng đã trưởng thành nhất, hạ tầng đã được chứng minh, nhưng giới hạn chính là độ dài ngữ cảnh. Hướng thứ hai là học theo trọng số, thực hiện cập nhật tham số thực sự—như lớp nhớ rải rác, vòng lặp học tăng cường, huấn luyện trong lúc thử nghiệm. Hướng trung gian là mô-đun hóa, thông qua các mô-đun kiến thức có thể cắm vào để chuyên môn hóa mà không động đến trọng số cốt lõi.

Hướng nghiên cứu về trọng số đặc biệt nhiều. Có phương pháp điều chỉnh chuẩn (như EWC), có huấn luyện trong lúc thử nghiệm (để tối ưu hóa gradient trong suy luận), có meta-learning (huấn luyện mô hình để học cách học), còn có tự蒸餾, tự cải tiến đệ quy nữa. Các hướng này đang hội tụ, hệ thống thế hệ tiếp theo rất có thể sẽ kết hợp nhiều chiến lược.

Nhưng có một vấn đề then chốt: cập nhật trọng số đơn thuần trong môi trường sản xuất sẽ gặp vô số vấn đề. Quên cục bộ, phân tách thời gian, thất bại trong tích hợp logic, và đặc biệt là các thao tác quên không thể thực hiện được do tính chất căn bản của vấn đề. Thêm vào đó là các vấn đề an toàn và quản trị—một khi mở rộng giới hạn huấn luyện và triển khai, khả năng phù hợp có thể sụp đổ, các hình thức tấn công dữ liệu độc hại lộ ra, khả năng kiểm tra minh bạch bị mất, rủi ro về quyền riêng tư tăng cao. Đây đều là các vấn đề mở, nhưng cũng nằm trong chương trình nghiên cứu.

Điều thú vị là, hệ sinh thái khởi nghiệp đã bắt đầu hoạt động ở các cấp độ này. Ở phía ngữ cảnh có Letta, mem0 và các công ty vỏ bọc quản lý chiến lược ngữ cảnh; về trọng số có các nhóm thử nghiệm nén một phần, vòng phản hồi RL, phương pháp trung tâm dữ liệu, và cả những nhóm táo bạo đang thiết kế lại kiến trúc bản thân. Chưa có phương pháp nào thắng thế rõ ràng, và xét đến đa dạng của các ứng dụng, có thể không nên chỉ có một người chiến thắng duy nhất.

Từ một góc nhìn nào đó, chúng ta đang đứng trước một điểm chuyển đổi. Hệ thống truy xuất thực sự mạnh mẽ, nhưng truy xuất mãi mãi không thể thay thế việc học. Một mô hình thực sự có thể tiếp tục nén kinh nghiệm, nội hóa kiến thức mới sau khi triển khai, sẽ tạo ra giá trị cộng hưởng theo cách mà hệ thống hiện tại không thể làm được. Điều này có thể đòi hỏi tiến bộ trong kiến trúc rải rác, học meta, vòng tự cải tiến—và cũng có thể đồng nghĩa với việc chúng ta phải định nghĩa lại chính khái niệm "mô hình"—không còn là một tập hợp trọng số cố định, mà là một hệ thống đang tiến hóa.

Triển vọng của học liên tục nằm ở đây. Tủ hồ sơ dù lớn đến đâu cũng chỉ là tủ hồ sơ, đột phá nằm ở chỗ làm sao để mô hình sau khi triển khai vẫn có thể tiếp tục huấn luyện, làm cho nó mạnh mẽ hơn: nén, trừu tượng, học thật sự. Nếu không, chúng ta sẽ mãi mắc kẹt trong hiện tại vĩnh cửu của chính mình.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim