Nhóm của Yann LeCun đề xuất lập kế hoạch phân lớp dựa trên mô hình thế giới tiềm ẩn đa thời gian, giải quyết vấn đề tích tụ dự đoán và tăng trưởng theo cấp số nhân của không gian tìm kiếm trong kiểm soát dài hạn. Bằng cách học mô hình tiềm ẩn trên các khung thời gian khác nhau và lập kế hoạch xuyên các cấp, thực hiện suy luận dài hạn và giảm đáng kể độ phức tạp của suy luận, đồng thời có thể như một mô-đun trừu tượng dạng plugin phù hợp với nhiều kiến trúc khác nhau. Thử nghiệm trên nhiệm vụ robot không tham lam thực tế (bắt và thả), chỉ cung cấp mục tiêu cuối cùng, tỷ lệ thành công của lập kế hoạch phân lớp đạt 70%, mô hình đơn lớp là 0%; trong mô phỏng vật lý (đẩy, mê cung), lập kế hoạch phân lớp nâng cao tỷ lệ thành công và giảm thời gian lập kế hoạch khoảng 3 lần. Phương pháp này không dựa vào phần thưởng nhiệm vụ hoặc mục tiêu phụ bên ngoài, có khả năng tổng quát mạnh. Nguồn: InFoQ

MeNews

2026-05-01 07:49:48

Đang tạo bản tóm tắt

Thông tin ME News, ngày 8 tháng 4 (UTC+8), gần đây, nhóm của Yann LeCun đã đề xuất một phương pháp lập kế hoạch phân lớp dựa trên mô hình thế giới tiềm năng đa thời gian, nhằm giải quyết hai thách thức chính của mô hình thế giới học tập trong kiểm soát dài hạn: tích lũy dự đoán sai và tăng trưởng không gian tìm kiếm theo cấp số nhân. Phương pháp này học mô hình thế giới tiềm năng ở các quy mô thời gian khác nhau và thực hiện lập kế hoạch phân lớp xuyên quy mô, giúp suy luận trong thời gian dài đồng thời giảm đáng kể độ phức tạp của lập kế hoạch khi suy luận. Khung này có thể như một mô-đun trừu tượng dạng plugin, phù hợp với nhiều kiến trúc mô hình thế giới tiềm năng và lĩnh vực khác nhau. Các thử nghiệm cho thấy, trong các nhiệm vụ robot không tham lam trong thế giới thực (như bắt và thả), chỉ cần mục tiêu cuối cùng, lập kế hoạch phân lớp đạt tỷ lệ thành công 70%, trong khi mô hình thế giới đơn lớp chỉ đạt 0%. Trong môi trường mô phỏng dựa trên vật lý (như thao tác đẩy và điều hướng mê cung), lập kế hoạch phân lớp không những đạt tỷ lệ thành công cao hơn mà còn giảm đến 3 lần thời gian tính toán lập kế hoạch cần thiết. Phương pháp này không dựa vào phần thưởng nhiệm vụ đặc thù hoặc mục tiêu phụ được cung cấp từ bên ngoài, thể hiện khả năng tổng quát mạnh mẽ trong các môi trường và nhiệm vụ chưa từng thấy. (Nguồn: InFoQ)

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

Phần thưởng
Thích
Bình luận
Đăng lại
Retweed

Bình luận

Thêm một bình luận

Không có bình luận

Chủ đề thịnh hành
Xem thêm
#
WCTCTradingKingPK
440.19K Phổ biến
#
USSeeksStrategicBitcoinReserve
58.68M Phổ biến
#
IsraelStrikesIranBTCPlunges
37.22K Phổ biến
#
BitcoinETFOptionLimitQuadruples
979.89K Phổ biến
#
#FedHoldsRateButDividesDeepen
30.42K Phổ biến

Ghim

sơ đồ trang web

Nhóm của Yann LeCun đề xuất phương pháp lập kế hoạch phân lớp, nâng cao khả năng suy luận trong miền thời gian dài của mô hình thế giới JEPA

Chủ đề thịnh hành

WCTCTradingKingPK

USSeeksStrategicBitcoinReserve

IsraelStrikesIranBTCPlunges

BitcoinETFOptionLimitQuadruples

#FedHoldsRateButDividesDeepen

Ghim