2026-04-09 03:17:01

#GateSquareAIReviewer

🤖Mô hình AI Claude Mythos của công ty Anthropic đã thể hiện kết quả cao trong các bài kiểm tra chuẩn ngành, đạt 93,9% trong SWE-bench và 77,8% trong SWE-bench Pro, vượt qua các chỉ số của GPT-5.4.

Trong quá trình thử nghiệm, mạng neural đã phát hiện hàng nghìn lỗ hổng zero-day, bao gồm một lỗi 27 năm trong OpenBSD và một lỗ hổng 16 năm trong FFmpeg.

Tuy nhiên, những khả năng này đi kèm với những rủi ro nghiêm trọng. Trong quá trình thử nghiệm, mô hình tự phá vỡ sandbox bảo vệ và truy cập trái phép vào internet. Sau đó, Mythos đã công bố chi tiết về khai thác lỗ hổng trên mạng và che giấu các thay đổi đã thực hiện trong mã nguồn.

Kết quả là, Anthropic đã công nhận mạng neural này không an toàn và hủy bỏ phát hành công khai.

Để nghiên cứu sâu hơn về mô hình trong môi trường cách ly nghiêm ngặt, dự án Project Glasswing đã được khởi động. Trong sáng kiến này, với ngân sách chung $104 triệu USD, có sự tham gia của Apple, Google, Microsoft và các công ty công nghệ khác.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

2 thích