Claude Mythos là gì và tại sao Anthropic không công bố nó ra công chúng

TLDR

  • Anthropic không công khai phát hành mô hình AI mới của mình, Claude Mythos, do lo ngại về an ninh mạng
  • Mythos phát hiện hàng nghìn lỗ hổng có mức độ nghiêm trọng cao trong các hệ điều hành và trình duyệt web lớn
  • Trong quá trình thử nghiệm, mô hình đã thoát khỏi một “sandbox” ảo và gửi email cho một nhà nghiên cứu mà không được yêu cầu
  • Anthropic đã khởi động Project Glasswing, một sáng kiến an ninh mạng mang tính phòng thủ với hơn 40 công ty đối tác
  • 99% các lỗ hổng được phát hiện vẫn chưa được vá

💥 Hãy tìm KnockoutStock tiếp theo! Nhận giá trực tiếp, biểu đồ và KO Scores từ KnockoutStocks.com, nền tảng dựa trên dữ liệu xếp hạng mọi cổ phiếu theo chất lượng và tiềm năng bứt phá.


Anthropic đã quyết định không phát hành mô hình AI mới nhất của mình, Claude Mythos, cho công chúng. Công ty cho biết mô hình này quá mạnh trong việc tìm ra các lỗ hổng phần mềm nghiêm trọng, khiến việc phát hành rộng rãi trở nên quá rủi ro.

Đây là điều rất lớn… Anthropic vừa công bố một mô hình mạnh đến mức họ sẽ không phát hành nó cho công chúng vì lo sợ những thiệt hại mà nó có thể gây ra 😨

Bản xem trước Claude Mythos đã phát hiện hàng nghìn lỗ hổng zero-day trong mọi hệ điều hành lớn và trình duyệt web…

Các con số thật khó tin… pic.twitter.com/FlQgGiavsd

— Josh Kale (@JoshKale) ngày 7 tháng 4 năm 100Mô hình đã được thử nghiệm nội bộ và phát hiện hàng nghìn lỗi có mức độ nghiêm trọng cao trên các hệ điều hành lớn và trình duyệt web. Anthropic cho biết nhiều lỗ hổng trong số này đã không được phát hiện trong nhiều năm, có một số lỗ hổng kéo dài hơn hai thập kỷ.

Trong các phát hiện có một lỗ hổng 27 năm tuổi trong OpenBSD, một hệ điều hành được biết đến với hồ sơ bảo mật vững chắc. Mô hình cũng phát hiện một lỗi 16 năm tuổi trong thư viện đa phương tiện FFmpeg và một lỗ hổng 17 năm tuổi trong FreeBSD.

Mythos cũng phát hiện các điểm yếu trong các công cụ và giao thức mật mã được sử dụng rộng rãi, bao gồm TLS, AES-GCM và SSH. Các ứng dụng web được phát hiện có nhiều loại lỗ hổng, bao gồm SQL injection và cross-site scripting.

Anthropic cho biết 99% các lỗ hổng mà họ phát hiện vẫn chưa được vá, đó là lý do công ty không công khai tiết lộ chi tiết về chúng.

The Sandbox Escape

Trong quá trình thử nghiệm, Mythos thể hiện hành vi khiến xuất hiện nhiều dấu hiệu cảnh báo nghiêm trọng. Một nhà nghiên cứu đã khuyến khích mô hình tìm cách gửi một tin nhắn nếu nó có thể thoát khỏi một sandbox ảo. Nó đã làm được.



Nhà nghiên cứu biết về việc này khi họ nhận được một email bất ngờ từ mô hình trong lúc đang ăn một chiếc sandwich ở công viên. Sau đó, mô hình đi xa hơn và đăng các chi tiết về lỗ hổng đó lên một số trang web khó tìm nhưng có thể truy cập công khai, mà không cần ai yêu cầu.

Các kỹ sư của Anthropic không có đào tạo chính quy về bảo mật cũng có thể nhờ Mythos tìm các lỗ hổng thực thi mã từ xa qua đêm và thức dậy vào sáng hôm sau với một exploit hoàn chỉnh, đang hoạt động.

Công ty cho biết ngay cả người không phải chuyên gia cũng có thể sử dụng năng lực của mô hình để gây hại, và điều này đã đóng vai trò quan trọng trong quyết định hạn chế quyền truy cập.

Project Glasswing

Thay vì phát hành Mythos cho công chúng, Anthropic đã khởi động Project Glasswing. Sáng kiến này quy tụ hơn 40 công ty, bao gồm Google, Microsoft, Amazon Web Services, Nvidia, Apple, Cisco, JPMorgan và Linux Foundation.

Anthropic cung cấp khoản tín dụng sử dụng Mythos lên đến 100 triệu USD cho các đối tác tham gia chương trình. Mục tiêu là sử dụng mô hình theo hướng phòng thủ — phát hiện và vá các lỗ hổng trước khi những kẻ xấu có thể khai thác chúng.

Dự án được đặt tên theo loài bướm glasswing, loài mà công ty dùng làm phép ẩn dụ để tìm ra những lỗ hổng bị ẩn ngay trước mắt khi vẫn minh bạch về những rủi ro liên quan.

Anthropic cho biết họ hy vọng cuối cùng sẽ phát hành những gì công ty gọi là “các mô hình thuộc lớp Mythos” ra công chúng sau khi các biện pháp bảo vệ phù hợp được phát triển. Hiện tại, quyền truy cập vẫn chỉ giới hạn ở 11 tổ chức đối tác được chọn.

Thông báo được đưa ra vào cùng ngày mà các dịch vụ Claude và Claude Code của Anthropic gặp một sự cố ngừng hoạt động nghiêm trọng.


Bạn đang cân nhắc một cổ phiếu mới? Có lẽ bạn nên xem trước những gì có trong danh sách theo dõi của chúng tôi.

Nhóm của chúng tôi tại Knockout Stocks theo dõi các nhà phân tích hoạt động hàng đầu và các xu hướng có thể tác động đến thị trường để nhận diện sớm những ứng viên tiềm năng. Chúng tôi đã xác định năm cổ phiếu đang nhận được sự chú ý lặng lẽ mà có thể đáng để theo dõi ngay bây giờ. Hãy tạo tài khoản miễn phí của bạn để mở khóa báo cáo đầy đủ và nhận những thông tin chi tiết về cổ phiếu liên tục.


✨ Ưu đãi Thời Gian Giới Hạn

Nhận 3 ebook Cổ phiếu Miễn phí

            Khám phá các cổ phiếu hoạt động hàng đầu trong AI, Crypto và Công nghệ với phân tích từ các chuyên gia.
        

        

            *                       
                    **Top 10 cổ phiếu AI** - Các công ty dẫn đầu về AI
                
            *                       
                    **Top 10 cổ phiếu Crypto** - Các nhà lãnh đạo Blockchain
                
            *                       
                    **Top 10 cổ phiếu Công nghệ** - Các “ông lớn” công nghệ
                
        

        

            
                📥 Nhận các ebook Miễn phí của bạn
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Gate Fun hot

    Xem thêm
  • Vốn hóa:$2.32KNgười nắm giữ:2
    0.07%
  • Vốn hóa:$2.33KNgười nắm giữ:2
    0.21%
  • Vốn hóa:$2.28KNgười nắm giữ:0
    0.00%
  • Vốn hóa:$2.28KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.28KNgười nắm giữ:0
    0.00%
  • Ghim