Beating giám sát hiển thị, AgentFlow tự động tổng hợp nhiều tác nhân harness, sử dụng DSL đồ thị có kiểu để thống nhất năm yếu tố (vai trò, cấu trúc, mẫu tin nhắn, liên kết công cụ, giao thức điều phối) thành chương trình đồ thị có thể chỉnh sửa, vòng ngoài dùng tín hiệu thời gian chạy để định vị thất bại. Dự án Chrome trong khoảng 210 tác nhân, 18 vai trò, 192 khám phá song song, trong 7 ngày phát hiện 10 lỗ hổng zero-day, 6 CVE (bao gồm trốn sandbox), AgentFlow đã mở mã nguồn.

BlockBeatNews

2026-04-23 06:51:01

Đang tạo bản tóm tắt

Theo giám sát Beating, nhóm của Feng Yu tại UCSB phối hợp với các tổ chức như fuzz.land đã đề xuất AgentFlow, một hệ thống tự động tổng hợp nhiều agent harness (chương trình điều phối phân công vai trò agent, truyền thông tin, phân phối công cụ và logic thử lại) để phát hiện lỗ hổng. Bài báo chỉ ra rằng khi mô hình không đổi, chỉ cần thay đổi harness có thể tăng tỷ lệ thành công gấp nhiều lần, nhưng các phương pháp hiện tại chủ yếu là viết thủ công hoặc chỉ tìm kiếm không gian thiết kế cục bộ.

AgentFlow sử dụng DSL đồ thị có kiểu để thống nhất năm chiều của harness (vai trò, topology, mẫu tin nhắn, liên kết công cụ, giao thức phối hợp) thành một chương trình đồ thị có thể chỉnh sửa, có thể thêm hoặc sửa đổi agent, topology, prompt và bộ công cụ trong từng bước. Vòng lặp ngoài xác định các phần thất bại dựa trên các tín hiệu chạy thời gian như độ phủ của chương trình mục tiêu, báo cáo sanitizer, thay thế phản hồi dạng nhị phân qua/failed. Trên TerminalBench-2, kết hợp với Claude Opus 4.6 đạt tỷ lệ 84.3% (75/89), cao nhất trong bảng xếp hạng cùng loại.

Trên kho mã Chrome (3,5 triệu dòng C/C++), hệ thống đã tổng hợp một harness chứa 18 vai trò, khoảng 210 agent, gồm 7 bộ phân tích hệ thống con, 192 trình khám phá song song, và một dây chuyền phân loại crash theo bốn giai đoạn, do các agent chuyên trách như Crash Filter và Root Cause Analyzer thực hiện loại bỏ trùng lặp qua duy nhất ASAN crash signature. Sử dụng mô hình mã nguồn mở Kimi K2.5 chạy trên 192 card H100 trong 7 ngày, phát hiện 10 lỗ hổng zero-day, tất cả đều được xác nhận qua Chrome VRP. 6 trong số đó đã có mã CVE, liên quan đến WebCodecs, Proxy, Network, Codecs, Rendering, gồm các loại UAF, tràn số nguyên và tràn bộ đệm heap, trong đó CVE-2026-5280 và CVE-2026-6297 là các lỗ hổng Critical về trốn sandbox.

Sự đồng sáng lập fuzz.land, Shou Chaofan, cho biết một số lỗ hổng ban đầu được phát hiện bằng MiniMax M2.5, và MiniMax M2.5 cùng Opus 4.6 cũng có thể phát hiện phần lớn các lỗ hổng này. AgentFlow đã mở mã nguồn.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

Phần thưởng
Thích
Bình luận
Đăng lại
Retweed

Bình luận

Thêm một bình luận

Không có bình luận

Chủ đề thịnh hành
Xem thêm
#
WCTCTradingKingPK
155.13K Phổ biến
#
CryptoMarketSeesVolatility
221.88K Phổ biến
#
IsraelStrikesIranBTCPlunges
31.45K Phổ biến
#
rsETHAttackUpdate
68.07K Phổ biến
#
US-IranTalksStall
176.67K Phổ biến

Ghim

sơ đồ trang web

AgentFlow tự động tổng hợp hệ thống đa tác nhân khai thác lỗ hổng zero-day trốn thoát sandbox Chrome

Chủ đề thịnh hành

WCTCTradingKingPK

CryptoMarketSeesVolatility

IsraelStrikesIranBTCPlunges

rsETHAttackUpdate

US-IranTalksStall

Ghim