AgentFlow tự động tổng hợp hệ thống đa tác nhân khai thác lỗ hổng zero-day trốn thoát sandbox Chrome

robot
Đang tạo bản tóm tắt

Theo giám sát Beating, nhóm của Feng Yu tại UCSB phối hợp với các tổ chức như fuzz.land đã đề xuất AgentFlow, một hệ thống tự động tổng hợp nhiều agent harness (chương trình điều phối phân công vai trò agent, truyền thông tin, phân phối công cụ và logic thử lại) để phát hiện lỗ hổng. Bài báo chỉ ra rằng khi mô hình không đổi, chỉ cần thay đổi harness có thể tăng tỷ lệ thành công gấp nhiều lần, nhưng các phương pháp hiện tại chủ yếu là viết thủ công hoặc chỉ tìm kiếm không gian thiết kế cục bộ.

AgentFlow sử dụng DSL đồ thị có kiểu để thống nhất năm chiều của harness (vai trò, topology, mẫu tin nhắn, liên kết công cụ, giao thức phối hợp) thành một chương trình đồ thị có thể chỉnh sửa, có thể thêm hoặc sửa đổi agent, topology, prompt và bộ công cụ trong từng bước. Vòng lặp ngoài xác định các phần thất bại dựa trên các tín hiệu chạy thời gian như độ phủ của chương trình mục tiêu, báo cáo sanitizer, thay thế phản hồi dạng nhị phân qua/failed. Trên TerminalBench-2, kết hợp với Claude Opus 4.6 đạt tỷ lệ 84.3% (75/89), cao nhất trong bảng xếp hạng cùng loại.

Trên kho mã Chrome (3,5 triệu dòng C/C++), hệ thống đã tổng hợp một harness chứa 18 vai trò, khoảng 210 agent, gồm 7 bộ phân tích hệ thống con, 192 trình khám phá song song, và một dây chuyền phân loại crash theo bốn giai đoạn, do các agent chuyên trách như Crash Filter và Root Cause Analyzer thực hiện loại bỏ trùng lặp qua duy nhất ASAN crash signature. Sử dụng mô hình mã nguồn mở Kimi K2.5 chạy trên 192 card H100 trong 7 ngày, phát hiện 10 lỗ hổng zero-day, tất cả đều được xác nhận qua Chrome VRP. 6 trong số đó đã có mã CVE, liên quan đến WebCodecs, Proxy, Network, Codecs, Rendering, gồm các loại UAF, tràn số nguyên và tràn bộ đệm heap, trong đó CVE-2026-5280 và CVE-2026-6297 là các lỗ hổng Critical về trốn sandbox.

Sự đồng sáng lập fuzz.land, Shou Chaofan, cho biết một số lỗ hổng ban đầu được phát hiện bằng MiniMax M2.5, và MiniMax M2.5 cùng Opus 4.6 cũng có thể phát hiện phần lớn các lỗ hổng này. AgentFlow đã mở mã nguồn.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim