Viện Nghiên cứu An toàn AI Vương quốc Anh: Xem trước Claude Mythos trở thành AI đầu tiên tự thực hiện mô phỏng tấn công mạng doanh nghiệp 32 bước độc lập

robot
Đang tạo bản tóm tắt

Tin ME News, ngày 14 tháng 4 (UTC+8), theo dõi của 1M AI News, Viện An toàn AI Anh Quốc (AISI) đã công bố đánh giá khả năng an ninh mạng của Claude Mythos Preview. Trong nhiệm vụ CTF cấp chuyên gia (không có mô hình nào có thể hoàn thành trước tháng 4 năm 2025), Mythos Preview đạt tỷ lệ thành công 73%. AISI cũng đã xây dựng “The Last Ones” (TLO) - một kịch bản mô phỏng tấn công mạng doanh nghiệp gồm 32 bước, bao gồm từ khảo sát ban đầu đến kiểm soát hoàn toàn mạng lưới, mất khoảng 20 giờ để con người hoàn thành. Mythos Preview là mô hình đầu tiên hoàn thành toàn bộ quá trình, trong 10 lần thử, 3 lần hoàn thành đầy đủ, trung bình thử 22 bước mỗi lần. Claude Opus 4.6 xếp thứ hai, trung bình hoàn thành 16 bước. AISI giải thích rằng, các kết quả trên đều đạt được trong điều kiện kiểm soát rõ ràng, có hướng dẫn rõ ràng và cung cấp quyền truy cập mạng. Môi trường thử nghiệm khác biệt lớn so với mạng doanh nghiệp thực tế: không có phòng thủ chủ động, không có công cụ phòng thủ, việc kích hoạt cảnh báo an ninh cũng không bị phạt. Do đó, không thể xác nhận Mythos Preview có thể xâm nhập hệ thống bảo vệ nghiêm ngặt hay không. Hai năm trước, mô hình AI tốt nhất hầu như không thể hoàn thành nhiệm vụ mạng sơ cấp. AISI chỉ ra rằng, tốc độ tiến bộ này yêu cầu phương pháp đánh giá an ninh cũng phải nâng cấp theo, trong tương lai sẽ tiếp tục thử nghiệm trong môi trường mô phỏng có phòng thủ chủ động và phản hồi theo thời gian thực. (Nguồn: BlockBeats)

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim