Anh đánh giá AISI của Anh cho biết, Claude Mythos Preview đạt tỷ lệ thành công 73% trong các nhiệm vụ tấn công phòng thủ mạng cấp chuyên gia, và lần đầu tiên hoàn thành toàn bộ cuộc thi The Last Ones 32 bước giả lập tấn công phòng thủ, trung bình hoàn thành khoảng 22 bước; Opus 4.6 trung bình 16 bước. Các bài kiểm tra được thực hiện trong môi trường kiểm soát, thiếu các công cụ phòng thủ chủ động và phòng thủ, không thể so sánh với việc tấn công phá vỡ hệ thống thực tế. AISI cho biết trong tương lai sẽ tiếp tục đánh giá trong môi trường mô phỏng có phòng thủ chủ động để nâng cao phương pháp đánh giá an ninh.

MeNews

2026-04-29 11:06:33

Đang tạo bản tóm tắt

Tin ME News, ngày 14 tháng 4 (UTC+8), theo dõi của 1M AI News, Viện An toàn AI Anh Quốc (AISI) đã công bố đánh giá khả năng an ninh mạng của Claude Mythos Preview. Trong nhiệm vụ CTF cấp chuyên gia (không có mô hình nào có thể hoàn thành trước tháng 4 năm 2025), Mythos Preview đạt tỷ lệ thành công 73%. AISI cũng đã xây dựng “The Last Ones” (TLO) - một kịch bản mô phỏng tấn công mạng doanh nghiệp gồm 32 bước, bao gồm từ khảo sát ban đầu đến kiểm soát hoàn toàn mạng lưới, mất khoảng 20 giờ để con người hoàn thành. Mythos Preview là mô hình đầu tiên hoàn thành toàn bộ quá trình, trong 10 lần thử, 3 lần hoàn thành đầy đủ, trung bình thử 22 bước mỗi lần. Claude Opus 4.6 xếp thứ hai, trung bình hoàn thành 16 bước. AISI giải thích rằng, các kết quả trên đều đạt được trong điều kiện kiểm soát rõ ràng, có hướng dẫn rõ ràng và cung cấp quyền truy cập mạng. Môi trường thử nghiệm khác biệt lớn so với mạng doanh nghiệp thực tế: không có phòng thủ chủ động, không có công cụ phòng thủ, việc kích hoạt cảnh báo an ninh cũng không bị phạt. Do đó, không thể xác nhận Mythos Preview có thể xâm nhập hệ thống bảo vệ nghiêm ngặt hay không. Hai năm trước, mô hình AI tốt nhất hầu như không thể hoàn thành nhiệm vụ mạng sơ cấp. AISI chỉ ra rằng, tốc độ tiến bộ này yêu cầu phương pháp đánh giá an ninh cũng phải nâng cấp theo, trong tương lai sẽ tiếp tục thử nghiệm trong môi trường mô phỏng có phòng thủ chủ động và phản hồi theo thời gian thực. (Nguồn: BlockBeats)

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

Phần thưởng
Thích
Bình luận
Đăng lại
Retweed

Bình luận

Thêm một bình luận

Không có bình luận

Chủ đề thịnh hành
Xem thêm
#
WCTCTradingKingPK
370.25K Phổ biến
#
CryptoMarketsDipSlightly
274.77K Phổ biến
#
IsraelStrikesIranBTCPlunges
36.16K Phổ biến
#
#DailyPolymarketHotspot
703.11K Phổ biến
#
StrategyAccumulates2xMiningRate
139.54M Phổ biến

Ghim

sơ đồ trang web

Viện Nghiên cứu An toàn AI Vương quốc Anh: Xem trước Claude Mythos trở thành AI đầu tiên tự thực hiện mô phỏng tấn công mạng doanh nghiệp 32 bước độc lập

Chủ đề thịnh hành

WCTCTradingKingPK

CryptoMarketsDipSlightly

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

StrategyAccumulates2xMiningRate

Ghim