Microsoft MDASH đứng đầu bảng xếp hạng CyberGym, tỷ lệ tái tạo lỗ hổng đạt 88,4%

robot
Đang tạo bản tóm tắt

AIMPACT Tin nhắn, ngày 14 tháng 5 (UTC+8), bảng xếp hạng cập nhật khung đánh giá an ninh mạng CyberGym, Microsoft MDASH (hệ thống đa mô hình) xếp hạng số 1 với tỷ lệ thành công tái tạo lỗ hổng 88,4%, vượt qua Anthropic Agent (83,1%) và OpenAI Agent (GPT-5.5, 81,8%). Khung này bao gồm 1507 ví dụ kiểm thử chuẩn, bao gồm các lỗ hổng lịch sử của 188 dự án phần mềm lớn. MDASH không chỉ tái tạo các lỗ hổng đã biết mà còn phát hiện 35 lỗ hổng zero-day và 17 bản vá chưa hoàn chỉnh trong lịch sử. CyberGym được xây dựng dựa trên các lỗ hổng thực tế phát hiện qua OSS-Fuzz, môi trường đánh giá bao gồm kho mã trước bản vá, yêu cầu代理 phải suy luận toàn bộ kho mã (hàng nghìn tệp, hàng triệu dòng mã) để tạo ra bằng chứng khả thi. Nhóm An ninh Mã tự trị của Microsoft, bao gồm Taesoo Kim, đã được ghi nhận. (Nguồn: InFoQ)

4-1,28%
ANTHROPIC-2,18%
OPENAI-0,57%
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim