Phòng thí nghiệm Alibaba Tongyi công bố VimRAG: Tái cấu trúc suy luận truy xuất đa phương thức bằng sơ đồ trí nhớ

robot
Đang tạo bản tóm tắt

Tin tức từ Coinjie.com, tin tức của ME News, ngày 10 tháng 4 (UTC+8), Phòng thí nghiệm Tongyi của Alibaba (Tongyi Lab) chính thức ra mắt khung RAG đa mô hình thế hệ mới VimRAG, tập trung giải quyết vấn đề “khoảng trống trạng thái” tồn tại lâu dài của hệ thống hiện tại.
VimRAG nâng cấp lịch sử tuyến tính truyền thống thành sơ đồ bộ nhớ đa mô hình (Multimodal Memory Graph), tổ chức quá trình suy luận theo cấu trúc đồ thị có hướng không vòng lặp động (DAG), loại bỏ hiệu quả các truy vấn trùng lặp và theo dõi toàn bộ quá trình khám phá.
Giới thiệu mã hóa bộ nhớ thị giác điều chế đồ thị (Graph-Modulated Visual Memory Encoding), thực hiện phân phối token tự thích ứng cho dữ liệu thị giác tải cao như hình ảnh, tích hợp cơ chế GGPO, đạt được phân phối tín dụng chi tiết, nâng cao độ chính xác trong suy luận và quy trách nhiệm.
Dựa trên dữ liệu đánh giá đã công bố, VimRAG thể hiện xuất sắc trong các bài kiểm tra chuẩn đa mô hình như SlideVQA, MMLongBench, LVBench, với điểm tổng hợp của phiên bản Qwen3-VL-8B-Instruct dẫn đầu các phương án cùng loại.
Mục tiêu của VimRAG là đẩy RAG đa mô hình từ “truy vấn đơn giản” sang “suy luận có cấu trúc đáng tin cậy”, cung cấp giải pháp hệ thống mạnh mẽ hơn cho xử lý các tài liệu dài phức tạp và các kịch bản pha trộn đa mô hình.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim