Nhóm của Yann LeCun đề xuất phương pháp lập kế hoạch phân lớp, nâng cao khả năng suy luận trong miền thời gian dài của mô hình thế giới JEPA

robot
Đang tạo bản tóm tắt

Thông tin ME News, ngày 8 tháng 4 (UTC+8), gần đây, nhóm của Yann LeCun đã đề xuất một phương pháp lập kế hoạch phân lớp dựa trên mô hình thế giới tiềm năng đa thời gian, nhằm giải quyết hai thách thức chính của mô hình thế giới học tập trong kiểm soát dài hạn: tích lũy dự đoán sai và tăng trưởng không gian tìm kiếm theo cấp số nhân. Phương pháp này học mô hình thế giới tiềm năng ở các quy mô thời gian khác nhau và thực hiện lập kế hoạch phân lớp xuyên quy mô, giúp suy luận trong thời gian dài đồng thời giảm đáng kể độ phức tạp của lập kế hoạch khi suy luận. Khung này có thể như một mô-đun trừu tượng dạng plugin, phù hợp với nhiều kiến trúc mô hình thế giới tiềm năng và lĩnh vực khác nhau. Các thử nghiệm cho thấy, trong các nhiệm vụ robot không tham lam trong thế giới thực (như bắt và thả), chỉ cần mục tiêu cuối cùng, lập kế hoạch phân lớp đạt tỷ lệ thành công 70%, trong khi mô hình thế giới đơn lớp chỉ đạt 0%. Trong môi trường mô phỏng dựa trên vật lý (như thao tác đẩy và điều hướng mê cung), lập kế hoạch phân lớp không những đạt tỷ lệ thành công cao hơn mà còn giảm đến 3 lần thời gian tính toán lập kế hoạch cần thiết. Phương pháp này không dựa vào phần thưởng nhiệm vụ đặc thù hoặc mục tiêu phụ được cung cấp từ bên ngoài, thể hiện khả năng tổng quát mạnh mẽ trong các môi trường và nhiệm vụ chưa từng thấy. (Nguồn: InFoQ)

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim