Mythos Preview đưa ngành trở lại phòng thủ: Cơ sở an toàn DeFi bị lung lay, nguồn lực AI đổ về lĩnh vực kiểm soát rủi ro

SnapshotBot · 2026-04-09T11:30:01+00:00

Ngành công nghiệp AI đang chuyển từ chức năng mạnh mẽ sang kiểm soát an toàn, các doanh nghiệp tập trung vào an ninh và quản lý rủi ro. Mô hình Mythos thể hiện xuất sắc nhưng hiện chỉ giới hạn trong thử nghiệm doanh nghiệp, rủi ro DeFi được định giá lại, kiểm toán an toàn AI trở thành tiêu chuẩn gia nhập, vốn tập trung vào các mô hình có thể kiểm soát, hệ sinh thái mở và nghiên cứu độc lập gặp khó khăn.

SnapshotBot

2026-04-09 11:30:01

Đang tạo bản tóm tắt

Mythos Khiến ngành AI chuyển sang phòng thủ: Một số vấn đề then chốt nổi lên

Tweet của Deedy Das không chỉ khơi dậy thảo luận, mà còn kéo cả ngành trở lại từ “mô hình mạnh đến đâu” sang “mô hình mạnh có thể làm được gì, và cần quản lý như thế nào”. Theo thông tin công khai, Mythos Preview đạt 99/100 trên BenchLM, nhiệm vụ tác nhân đạt điểm tối đa, và SWE-bench đạt khoảng 94% ở chuẩn mã hóa, rõ ràng cao hơn Claude Opus 4.6. Theo báo cáo, mô hình này dùng chưa tới 50 đô la tiền tính toán để định vị một lỗ hổng OpenBSD có từ 27 năm trước, và còn có thể tự nối chuỗi các lỗ hổng của nhân Linux. Karpathy, LeCun và những người khác vẫn chưa công khai phát biểu, có thể là vì mô hình vẫn chưa được mở cho các nhà nghiên cứu độc lập.

Nhận định của tôi: Sự chú ý của ngành đang chuyển từ “leo bảng bằng năng lực” sang “phòng thủ và quản trị”. Anthropic thông qua Project Glasswing để triển khai cấp quyền truy cập có giới hạn, muốn xử lý ổn thỏa vấn đề sử dụng hai mục đích trước đã.

Việc cấp phép cho doanh nghiệp tạo ra khoảng cách về tài nguyên và thông tin: Glasswing đã kéo vào hơn 40 đối tác hợp tác (Apple, Microsoft đều tham gia), cấp hạn mức 100 triệu đô la cho các kịch bản an ninh; các dự án mã nguồn mở rất khó để nhận được nguồn lực tương đương.
Giả định về an toàn của DeFi đang bị lung lay: Các hợp đồng on-chain đang khóa khoảng 2000 tỷ đô la. Sau khi Drift trên Solana mất 2.85 tỷ đô la, kế hoạch an toàn STRIDE mới được lên sóng. Công cụ phát hiện lỗ hổng do AI hỗ trợ ngày càng mạnh, những giao thức chưa làm xác thực hình thức sẽ bị những người gửi tiền soi xét bằng mức định giá rủi ro “gắt” hơn.
Tiền đi theo “AI có trách nhiệm”: Sau vòng G của Anthropic, định giá ngụ ý khoảng 3800 tỷ đô la, cho thấy nhà đầu tư nghiêng về định hướng an toàn. RSP 3.0 liệu có thể thực sự ngăn chặn lạm dụng hay không, còn phải quan sát.

Chấm điểm không phải tất cả: Lên sàn hay không còn tùy ngưỡng an toàn và tính kiểm soát

Việc mua sắm của doanh nghiệp nhìn vào câu hỏi “có thể triển khai an toàn lên môi trường vận hành hay không”, chứ không phải thứ hạng trên bảng xếp hạng. Sau khi xảy ra rò rỉ, mảng an ninh mạng rút lui 5–10%, cộng thêm việc không ai trong ngành công khai phản bác, đều cho thấy thị trường coi trọng “phòng thủ/kiểm soát rủi ro” hơn “năng lực”.

Góc nhìn	Căn cứ	Thay đổi	Đánh giá
Hướng năng lực	BenchLM 99/100, nhiệm vụ tác nhân đứng đầu, thử nghiệm nội bộ cho thấy chuỗi lỗ hổng của Firefox	Kỳ vọng của nhà phát triển đối với việc mã hóa/luồng công việc của tác nhân dùng AI tăng lên	Có thể bị thổi phồng; độ tin cậy của môi trường sản xuất và điểm số là hai chuyện khác nhau
Ưu tiên an toàn	Liên minh Glasswing, phát hiện lỗ hổng zero-day (ví dụ lỗ hổng FFmpeg cách đây 16 năm)	Các điểm yếu của hạ tầng được chú ý, thúc đẩy kiểm tra an ninh được hỗ trợ bởi AI	Bị đánh giá thấp; mức độ tin cậy của Anthropic với vai trò “đối tác an toàn” tăng lên, đối thủ khó theo kịp
Thận trọng của thị trường	Cổ phiếu an ninh giảm, tổn thất 2.85 tỷ đô la trên Solana	Nhà đầu tư đánh giá lại rủi ro lan truyền trong khung thời gian 6–18 tháng	Hợp lý trong ngắn hạn; công nghệ phòng thủ dài hạn có thể đem lại lợi nhuận vượt trội
Ngưỡng an toàn	Đánh giá RSP chưa chạm đến ngưỡng tự trị, nhưng mô hình vẫn chưa ra mắt bản thử nghiệm công khai	Ngành ưu tiên tuân thủ sẽ thích các mô hình đã được kiểm toán và được phát hành có kiểm soát	Khung hoạt động hiệu quả; không thân thiện với giới nghiên cứu, nhưng bên mua theo tuân thủ thích điều này

Sự đồng thuận đang hội tụ: Thay vì hỏi “AI còn có thể làm gì”, hãy hỏi “làm sao để nó làm việc trong phạm vi ranh giới”.

Thông tin then chốt

Mythos năng lực mạnh nhưng chỉ thí điểm cho doanh nghiệp: Điểm chuẩn cao cộng với mẫu zero-day thực tế, thêm việc doanh nghiệp được tiếp cận sớm ở cấp độ doanh nghiệp, tạo thành tổ hợp “năng lực cao + kiểm soát chặt chẽ quyền truy cập”.
Rủi ro của DeFi đang được định giá lại: Các hợp đồng giá trị cao phải đối mặt với tốc độ tấn công/phản công do AI thúc đẩy, xác thực hình thức và kiểm tra an ninh bằng AI sẽ từ hạng mục cộng điểm trở thành ngưỡng gia nhập.
Vốn và câu chuyện liên kết với nhau: Vốn, nhân tài hướng về “mô hình mạnh nhưng có thể kiểm soát”, hệ sinh thái mở và vị thế của nghiên cứu độc lập ngày càng trở nên bên lề.
Logic ra quyết định khi lên sàn đang thay đổi: ngưỡng an toàn, năng lực cách ly, và khả năng có thể kiểm toán đang thay thế “điểm số bảng xếp hạng” trở thành tiêu chí chính trong việc doanh nghiệp mua sắm.

Tính quan trọng: Cao
Danh mục: Phát hành mô hình｜An toàn AI｜Ảnh hưởng thị trường

Kết luận: Bên doanh nghiệp và bên vốn đã chấp nhận trả tiền cho định vị phòng thủ của Anthropic; nguy cơ bị gạt ra ngoài đang tăng lên đối với những Builder không coi trọng tích hợp an toàn, và các nhà nghiên cứu không có kênh dành cho doanh nghiệp.

Nhận định: Xét theo góc nhìn câu chuyện, hiện tại vẫn đang ở giai đoạn “khá sớm nhưng đang tăng tốc”; nhóm được hưởng lợi nhiều nhất là các Builder có năng lực an toàn và kênh tuân thủ, cùng với dòng vốn tổ chức. Các nhà giao dịch thứ cấp nên quan sát nhiều hơn sự thay đổi trong việc triển khai an toàn và cấu trúc cấp quyền truy cập; với những người chỉ nắm giữ “lộ diện” từ hệ sinh thái mở thì bối cảnh này không mấy thuận lợi.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.