Anthropic cùng 12 tập đoàn lớn phát động kế hoạch "Cánh kính", sử dụng mô hình mạnh nhất chưa được phát hành Mythos để vá lỗi phần mềm toàn cầu

Project Glasswing là một bước đi quan trọng để giúp những người phòng thủ xây dựng lợi thế bền vững trong kỷ nguyên an ninh mạng do AI dẫn dắt sắp tới.

Tác giả: Anthropic

Biên dịch: Deep Tide TechFlow

**Deep Tide giới thiệu: ** Anthropic đã công bố một mô hình tiên phong Claude Mythos Preview, hiện vẫn chưa được phát hành công khai; năng lực kiểm toán mã của nó đã vượt qua tuyệt đại đa số các chuyên gia bảo mật con người, có thể tự động phát hiện các lỗ hổng zero-day tồn tại hàng chục năm.

Dựa trên năng lực này, Anthropic phối hợp với 500Bập đoàn công nghệ lớn như AWS, Apple, Google, Microsoft, Nvidia… khởi động kế hoạch Project Glasswing, triển khai hạn mức tín dụng trị giá 100 triệu USD, với mục tiêu trước khi kẻ tấn công đạt được năng lực tương đương, hãy vá các lỗ hổng của phần mềm then chốt toàn cầu.

Giới thiệu

Hôm nay, chúng tôi công bố Project Glasswing (Kế hoạch Cánh Kính), một sáng kiến mới quy tụ các thành viên bao gồm Amazon Web Services (AWS), Anthropic, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, Linux Foundation, Microsoft, Nvidia và Palo Alto Networks, với mục tiêu bảo vệ an ninh cho phần mềm quan trọng nhất trên toàn cầu.

Chúng tôi khởi động Project Glasswing vì một mô hình tiên phong mới mà Anthropic huấn luyện đã thể hiện khả năng mà chúng tôi tin có thể định hình lại cục diện an ninh mạng. Claude Mythos Preview là một mô hình tiên phong đa dụng, chưa được phát hành; nó phơi bày một sự thật khắc nghiệt: năng lực lập trình của các mô hình AI đã đạt đến mức—trong việc phát hiện và khai thác lỗ hổng phần mềm—chúng có thể vượt qua toàn bộ mọi người, trừ những chuyên gia hàng đầu.

Mythos Preview đã phát hiện ra hàng nghìn lỗ hổng mức độ nghiêm trọng, trải rộng trên từng hệ điều hành phổ biến và từng trình duyệt phổ biến. Theo tốc độ tiến bộ của AI, năng lực này sẽ lan rộng trong một tương lai không xa, có thể rơi vào tay những người sử dụng thiếu trách nhiệm. Tác động đối với kinh tế, an toàn công cộng và an ninh quốc gia có thể rất nghiêm trọng. Project Glasswing là một nỗ lực cấp bách nhằm ưu tiên các năng lực đó cho mục đích phòng thủ.

Là một phần của Project Glasswing, các đối tác nói trên sẽ sử dụng Mythos Preview trong công việc an ninh mang tính phòng thủ của họ; Anthropic sẽ chia sẻ những điều đã học để toàn ngành được hưởng lợi. Chúng tôi cũng mở quyền truy cập cho hơn 100Mổ chức khác xây dựng hoặc duy trì hạ tầng phần mềm quan trọng, để họ có thể quét và gia cố các hệ thống của mình cũng như các hệ thống mã nguồn mở. Anthropic cam kết đầu tư lên tới 100 triệu USD hạn mức sử dụng Mythos Preview và 4 triệu USD quyên góp trực tiếp cho các tổ chức an ninh mã nguồn mở.

Project Glasswing chỉ là điểm khởi đầu. Không có bất kỳ tổ chức nào có thể tự mình giải quyết vấn đề an ninh mạng: các nhà phát triển AI tiên phong, các công ty phần mềm khác, các nhà nghiên cứu bảo mật, những người duy trì mã nguồn mở và các chính phủ trên khắp thế giới đều có vai trò không thể thay thế. Bảo vệ hạ tầng mạng toàn cầu có thể cần nhiều năm; trong khi năng lực AI tiên phong trong vài tháng tới có thể nhảy vọt đáng kể. Để người phòng thủ mạng giành lợi thế, phải hành động ngay bây giờ.

An ninh mạng trong kỷ nguyên AI

Phần mềm mà chúng ta phụ thuộc hằng ngày—chạy hệ thống ngân hàng, lưu trữ hồ sơ y tế, kết nối mạng logistics, duy trì hoạt động của lưới điện—vẫn luôn có bug. Phần lớn thì không đáng kể, nhưng một số lại là những khiếm khuyết nghiêm trọng về bảo mật; một khi bị phát hiện, kẻ tấn công có thể chiếm quyền hệ thống, làm tê liệt hoạt động hoặc đánh cắp dữ liệu.

Hậu quả phá hoại của các cuộc tấn công mạng đối với mạng doanh nghiệp, hệ thống y tế, cơ sở hạ tầng năng lượng, các trung tâm giao thông và các cơ quan chính phủ ở nhiều quốc gia đã được chứng minh rõ ràng. Ở cấp độ toàn cầu, các cuộc tấn công cấp nhà nước từ Trung Quốc, Iran, Triều Tiên và Nga đã đe dọa các cơ sở hạ tầng hỗ trợ đời sống dân sự và công tác chuẩn bị quân sự. Dù chỉ là các cuộc tấn công quy mô nhỏ nhắm vào một bệnh viện hay một trường học, chúng vẫn có thể gây tổn thất kinh tế lớn, làm lộ dữ liệu nhạy cảm và thậm chí đe dọa tính mạng. Tổn thất kinh tế hằng năm do tội phạm mạng trên toàn cầu rất khó ước tính chính xác, nhưng có thể vào khoảng 100Mỷ USD.

Trước đây, nhiều lỗi phần mềm mất nhiều năm mới bị phát hiện, vì việc tìm ra và khai thác chúng đòi hỏi kiến thức chuyên môn chỉ một số ít chuyên gia bảo mật mới có. Nhưng với sự xuất hiện của các mô hình AI tiên phong mới nhất, chi phí, công sức và ngưỡng chuyên môn cần thiết để phát hiện và khai thác lỗ hổng phần mềm đã giảm mạnh. Trong năm qua, các mô hình AI ngày càng mạnh hơn trong đọc mã và suy luận; đặc biệt, khả năng phát hiện lỗ hổng và xây dựng cách thức khai thác của chúng đã gây ấn tượng. Claude Mythos Preview đã đạt bước nhảy vọt trong các kỹ năng an ninh mạng đó—một số lỗ hổng mà nó phát hiện đã sống sót dù con người đã rà soát trong nhiều thập kỷ và trải qua hàng triệu lượt kiểm thử tự động về an ninh, trong khi mã khai thác do nó phát triển ngày càng tinh vi.

Sau mười năm kể từ cuộc thi DARPA Cyber Grand Challenge đầu tiên, các mô hình AI tiên phong đang tiến gần hoặc thậm chí bắt kịp khả năng phát hiện và khai thác lỗ hổng của những nhà nhân lực con người hàng đầu. Nếu không có các biện pháp bảo mật cần thiết, các năng lực mạng mạnh mẽ này có thể được dùng để khai thác số lượng lớn các lỗ hổng còn tồn tại trong những phần mềm quan trọng nhất toàn cầu. Các cuộc tấn công mạng sẽ trở nên thường xuyên hơn, gây phá hoại hơn và đồng thời giúp đối thủ của Mỹ và các đồng minh của họ mạnh lên. Đây là mức độ ưu tiên an ninh mà các quốc gia dân chủ phải coi trọng.

Tin tốt là: những năng lực khiến mô hình AI trở nên nguy hiểm khi rơi vào tay sai cũng khiến chúng cực kỳ có giá trị trong việc phát hiện và sửa các khiếm khuyết phần mềm quan trọng—đồng thời có thể giúp tạo ra phần mềm mới có ít lỗi bảo mật hơn. Project Glasswing là một bước quan trọng để giúp người phòng thủ xây dựng lợi thế bền vững trong kỷ nguyên an ninh mạng do AI dẫn dắt sắp tới.

Năng lực của Claude Mythos Preview trong phát hiện lỗ hổng và cách thức khai thác

Trong vài tuần qua, chúng tôi đã sử dụng Claude Mythos Preview để phát hiện hàng nghìn lỗ hổng zero-day (tức là các khiếm khuyết mà trước đó hoàn toàn không được các nhà phát triển phần mềm biết đến) trong từng hệ điều hành phổ biến, từng trình duyệt phổ biến và một loạt phần mềm quan trọng khác, trong đó có nhiều lỗ hổng thuộc mức độ nghiêm trọng cao.

Trên blog Frontier Red Team, chúng tôi đã công bố chi tiết kỹ thuật của một phần các lỗ hổng đã được sửa và các cách thức khai thác mà Mythos Preview tìm ra. Gần như toàn bộ việc phát hiện các lỗ hổng đó (và nhiều phần việc phát triển các khai thác liên quan) đều do mô hình thực hiện hoàn toàn tự chủ, không có bất kỳ hướng dẫn nào từ con người. Dưới đây là ba ví dụ:

  • Mythos Preview đã phát hiện một lỗ hổng tồn tại 27 năm trong OpenBSD. OpenBSD nổi tiếng với tiêu chuẩn gia cố an ninh rất cao, và được dùng rộng rãi cho tường lửa và các hạ tầng quan trọng khác. Lỗ hổng này cho phép kẻ tấn công làm sập từ xa chỉ bằng cách kết nối tới máy mục tiêu.
  • Nó cũng phát hiện một lỗ hổng 16 năm trong FFmpeg. FFmpeg được vô số phần mềm dùng để mã hóa/giải mã video. Vấn đề nằm ở một dòng mã, trong khi các công cụ kiểm thử tự động đã chạm vào dòng mã đó 5 triệu lần nhưng chưa bao giờ phát hiện ra vấn đề.
  • Mô hình đã tự phát hiện và kết nối một số lỗ hổng trong nhân Linux (nhân Linux vận hành phần lớn máy chủ trên toàn cầu), từ đó thực hiện một cuộc tấn công leo thang đặc quyền từ quyền người dùng thông thường lên toàn quyền kiểm soát máy.

Chúng tôi đã báo cáo toàn bộ các lỗ hổng nêu trên cho các bên duy trì phần mềm liên quan và đều đã được sửa. Đối với nhiều lỗ hổng khác, hôm nay chúng tôi cung cấp các chi tiết dạng mã băm mã hóa (xem blog Red Team), để chờ khi việc sửa hoàn tất rồi mới công bố thông tin cụ thể.

Các bộ đánh giá như CyberGym cũng xác nhận sự chênh lệch đáng kể giữa Mythos Preview và mô hình mạnh kém hơn của chúng tôi, Claude Opus 4.6:

Tái hiện lỗ hổng an ninh mạng - CyberGym

Ngoài công việc của chúng tôi, nhiều đối tác cũng đã sử dụng Claude Mythos Preview trong vài tuần. Dưới đây là phản hồi của họ:

“Khả năng AI đã vượt qua một ngưỡng, thay đổi tận gốc mức độ khẩn cấp cần thiết để bảo vệ các cơ sở hạ tầng then chốt khỏi các mối đe dọa mạng, và sự thay đổi đó là không thể đảo ngược. Công việc nền tảng mà chúng tôi xây dựng với các mô hình này cho thấy có thể nhận diện và sửa các lỗ hổng trong phần cứng và phần mềm với tốc độ và quy mô chưa từng có. Đây là một sự chuyển biến sâu sắc và là một tín hiệu rõ ràng: cách gia cố hệ thống cũ không còn đủ nữa. Các nhà cung cấp công nghệ cần ngay lập tức chủ động áp dụng các phương pháp mới, còn khách hàng cũng cần sẵn sàng cho việc triển khai. Đó là lý do Cisco tham gia Project Glasswing—công việc này quá quan trọng, quá cấp bách để làm một mình.”

—— Anthony Grieco, Phó chủ tịch cấp cao kiêm Giám đốc bảo mật và niềm tin (Chief Security and Trust Officer) của Cisco

“Ở AWS, chúng tôi xây dựng phòng thủ trước khi mối đe dọa xuất hiện—từ các con chip tùy chỉnh đến toàn bộ ngăn xếp công nghệ. Bảo mật không phải là chuyện của một giai đoạn; đó là hoạt động liên tục, được nhúng vào mọi thứ chúng tôi làm. Nhóm của chúng tôi phân tích hơn 4 triệu tỷ lượt lưu lượng mạng mỗi ngày để phát hiện mối đe dọa, và AI là cốt lõi trong năng lực phòng thủ quy mô lớn của chúng tôi. Chúng tôi đã thử nghiệm Claude Mythos Preview trong chính hoạt động Security Operations của mình hằng ngày, áp dụng vào các kho mã then chốt, và nó đang giúp chúng tôi gia cố mã. Chúng tôi đang đưa chuyên môn sâu về bảo mật từ hợp tác với Anthropic vào, đồng thời giúp củng cố Claude Mythos Preview để nhiều tổ chức có thể thúc đẩy công việc của mình theo tiêu chuẩn bảo mật cao nhất.”

—— Amy Herzog, Phó chủ tịch kiêm Giám đốc Thông tin (Chief Information Security Officer) của Amazon Web Services

“Khi an ninh mạng không còn bị giới hạn bởi năng lực thuần con người, cơ hội sử dụng AI một cách có trách nhiệm để nâng cao bảo mật trên quy mô lớn và giảm rủi ro là chưa từng có. Việc tham gia Project Glasswing và nhận quyền truy cập Claude Mythos Preview cho phép chúng tôi nhận diện và giảm thiểu rủi ro sớm hơn, tăng cường các giải pháp bảo mật và phát triển của chúng tôi để bảo vệ tốt hơn cho khách hàng và Microsoft. Khi thử nghiệm trên bộ chuẩn bảo mật mã nguồn mở CTI-REALM của chúng tôi, Claude Mythos Preview cho thấy sự cải thiện đáng kể so với các mô hình trước đó. Chúng tôi mong đợi hợp tác với Anthropic và ngành rộng hơn để cải thiện kết quả bảo mật cho tất cả mọi người.”

—— Igor Tsyganskiy, Phó Chủ tịch Điều hành An ninh mạng và Microsoft Research của Microsoft

“Khoảng thời gian từ khi lỗ hổng được phát hiện đến khi bị kẻ tấn công khai thác đã sụp đổ—điều trước đây phải mất vài tháng, giờ đây chỉ cần vài phút với AI. Claude Mythos Preview cho thấy khả năng hành động quy mô lớn của bên phòng thủ, trong khi đối thủ không thể tránh khỏi việc tìm kiếm cách khai thác cùng những năng lực đó. Đây không phải là lý do để chậm lại, mà là lý do để cùng tăng tốc. Muốn triển khai AI thì phải có đảm bảo an toàn. Đó là lý do CrowdStrike tham gia ngay từ ngày đầu.”

—— Elia Zaitsev, Giám đốc Công nghệ (Chief Technology Officer) của CrowdStrike

“Trước đây, kiến thức chuyên môn về bảo mật là một thứ xa xỉ chỉ các tổ chức có đội ngũ bảo mật lớn mới được tận hưởng. Những người duy trì phần mềm mã nguồn mở—những người mà phần mềm của họ nâng đỡ phần lớn các cơ sở hạ tầng then chốt trên toàn cầu—từ trước đến nay chỉ có thể tự mình xoay xở để xử lý các vấn đề bảo mật. Phần mềm mã nguồn mở cấu thành phần lớn mã trong các hệ thống hiện đại, bao gồm cả chính hệ thống mà các tác nhân AI dùng để viết phần mềm mới. Bằng cách cấp quyền truy cập các nhà duy trì cho những kho mã nguồn mở then chốt này tới các mô hình AI thế hệ mới—có khả năng chủ động nhận diện và sửa lỗi trên quy mô lớn—Project Glasswing cung cấp một con đường khả thi để thay đổi cục diện. Đây là cách mà bảo mật được tăng cường bằng AI có thể chuyển từ công cụ dành riêng cho các đội ngũ lớn thành trợ thủ đáng tin cậy cho từng người duy trì.”

—— Jim Zemlin, CEO của Linux Foundation

“Thúc đẩy an ninh mạng và khả năng phục hồi của hệ thống tài chính là cốt lõi trong sứ mệnh của JPMorgan Chase, và chúng tôi tin rằng khi các tổ chức dẫn đầu cùng hợp tác để thử thách các vấn đề, ngành sẽ mạnh nhất. Project Glasswing mang lại một cơ hội tiên phong độc đáo để chúng tôi đánh giá theo tiêu chuẩn của riêng mình năng lực của các công cụ AI thế hệ tiếp theo trong an ninh mạng phòng thủ cho cơ sở hạ tầng then chốt, đồng thời đứng vai sát vai với những nhà lãnh đạo công nghệ được tôn trọng. Chúng tôi sẽ tiếp cận một cách chặt chẽ và độc lập để xác định cách thức triển khai và cách chúng tôi có thể hỗ trợ. Sáng kiến của Anthropic thể hiện cách tiếp cận mang tính viễn kiến và hợp tác mà thời khắc này đòi hỏi.”

—— Pat Opet, Giám đốc An ninh Thông tin (Chief Information Security Officer) của JPMorgan Chase

“Chúng tôi rất vui khi thấy sáng kiến an ninh mạng theo hướng liên ngành này được hình thành, và thông qua Vertex AI để cung cấp Mythos Preview cho những người tham gia. Sự hợp tác của ngành trong các vấn đề an ninh mới nổi luôn đóng vai trò then chốt, dù đó là mật mã hậu lượng tử, việc công bố lỗ hổng zero-day có trách nhiệm, an ninh phần mềm mã nguồn mở hay phòng thủ trước các cuộc tấn công dựa trên AI. Chúng tôi luôn tin rằng AI vừa tạo ra thách thức mới vừa mang đến cơ hội mới cho phòng thủ mạng—đó là lý do chúng tôi xây dựng các công cụ AI như Big Sleep và CodeMender để phát hiện và sửa các khiếm khuyết phần mềm then chốt. Chúng tôi sẽ tiếp tục đầu tư vào các nền tảng an ninh mạng hàng đầu và một văn hóa coi trọng việc bảo vệ người dùng, khách hàng, hệ sinh thái và an ninh quốc gia.”

—— Heather Adkins, Phó chủ tịch phụ trách Kỹ thuật An ninh của Google

“Trong vài tuần qua, chúng tôi đã sử dụng mô hình Claude Mythos Preview để nhận diện những lỗ hổng phức tạp mà mô hình thế hệ trước đó hoàn toàn bỏ sót. Điều này không chỉ thay đổi luật chơi trong việc phát hiện các lỗ hổng ẩn giấu, mà còn có nghĩa là kẻ tấn công sẽ sớm có khả năng phát hiện nhiều lỗ hổng zero-day và phát triển mã khai thác nhanh hơn trước. Rõ ràng là các mô hình này cần được trao cho chủ sở hữu dự án mã nguồn mở và cho tất cả những người phòng thủ—trước khi kẻ tấn công có quyền truy cập—để họ có thể phát hiện và sửa lỗ hổng. Có lẽ quan trọng hơn: mọi người đều cần sẵn sàng cho những kẻ tấn công được AI hỗ trợ. Tấn công sẽ nhiều hơn, nhanh hơn và phức tạp hơn. Đã đến lúc nâng cấp toàn diện hệ thống an ninh mạng. Chúng tôi đánh giá cao việc Anthropic hợp tác với ngành để đảm bảo các năng lực mạnh mẽ này được ưu tiên phục vụ cho phòng thủ.”

—— Lee Klarich, Giám đốc Sản phẩm và Công nghệ (Chief Product and Technology Officer) của Palo Alto Networks

Năng lực an ninh mạng mạnh mẽ của Claude Mythos Preview đến từ khả năng mã hóa và suy luận vượt trội của các tác nhân. Kết quả đánh giá dưới đây cho thấy mô hình này đạt điểm cao nhất trong số tất cả các mô hình đã biết ở nhiều tác vụ mã hóa phần mềm.

Mã hóa bằng tác nhân

Suy luận

Tìm kiếm tác nhân và sử dụng máy tính

Ghi chú:

  • SWE-bench Verified、Pro và Multilingual: thẻ sàng lọc có ghi nhớ hóa đã đánh dấu một số đề bài. Sau khi loại trừ các đề bài có thể tồn tại ghi nhớ hóa, mức chênh lợi thế của Mythos Preview so với Opus 4.6 vẫn không đổi.
  • SWE-bench Multimodal: sử dụng hiện thực nội bộ, nên điểm số không thể so sánh trực tiếp với bảng xếp hạng công khai.
  • Terminal-Bench 2.0: sử dụng khung Terminus-2, ở chế độ tư duy thích ứng tối đa nỗ lực; ngân sách tổng cho mỗi tác vụ là 1 triệu token; cấu hình phân bổ tài nguyên theo xác suất đảm bảo 1x / trần 3x; mỗi tác vụ thử 5 lần lấy trung bình. Sau khi nâng giới hạn timeout lên 4 giờ và cập nhật lên Terminal-Bench 2.1, Mythos Preview đạt 92,1%.
  • BrowseComp: điểm của Claude Mythos Preview cao hơn Opus 4.6, đồng thời lượng token tiêu thụ chỉ bằng 1/4,9 của mô hình sau.
  • Humanity’s Last Exam: Mythos vẫn thể hiện tốt ở chế độ nỗ lực thấp, có thể tồn tại một mức độ ghi nhớ hóa nhất định.

Để biết thêm thông tin về năng lực, thuộc tính an toàn và các đặc điểm cơ bản của mô hình, vui lòng xem Claude Mythos Preview system card.

Chúng tôi không có kế hoạch mở Claude Mythos Preview cho công chúng, nhưng mục tiêu cuối cùng là để người dùng có thể triển khai an toàn các mô hình ở mức Mythos với quy mô lớn—không chỉ dùng cho an ninh mạng, mà còn cho vô số giá trị khác mà các mô hình năng lực cao như vậy có thể mang lại. Để làm được điều này, chúng tôi cần đạt tiến bộ trong việc phát triển các biện pháp bảo vệ an ninh mạng (và các biện pháp khác), để có thể phát hiện và ngăn chặn các đầu ra nguy hiểm nhất của mô hình. Chúng tôi dự định công bố các biện pháp bảo vệ mới trong mô hình Claude Opus sắp ra mắt, để chúng tôi có thể cải tiến và hoàn thiện các biện pháp này bằng một mô hình không có mức rủi ro ngang với Mythos Preview.

Kế hoạch tiếp theo của Project Glasswing

Lần công bố hôm nay là bước khởi đầu cho một nỗ lực dài hạn. Để thành công, cần có sự tham gia rộng rãi của cả ngành công nghệ lẫn những bên ngoài ngành.

Các đối tác của Project Glasswing sẽ nhận được quyền truy cập Claude Mythos Preview để phát hiện và sửa các lỗ hổng cũng như điểm yếu trong hệ thống nền tảng của họ—những hệ thống chiếm một tỷ lệ lớn trong bề mặt tấn công mạng dùng chung toàn cầu. Các mảng công việc trọng tâm dự kiến bao gồm phát hiện lỗ hổng cục bộ, kiểm thử hộp đen nhị phân, gia cố đầu cuối và kiểm thử xâm nhập hệ thống.

Hạn mức sử dụng 100 triệu USD mà Anthropic cam kết cho Project Glasswing và các bên tham gia sẽ bao phủ phần lớn mức sử dụng trong giai đoạn nghiên cứu và xem trước. Sau đó, Claude Mythos Preview sẽ được cung cấp cho các bên tham gia với giá 25 USD/125 USD cho mỗi một triệu token đầu vào/đầu ra (các bên tham gia có thể truy cập mô hình thông qua Claude API, Amazon Bedrock, Google Cloud Vertex AI và Microsoft Foundry).

Ngoài hạn mức sử dụng mô hình, chúng tôi cũng thông qua Linux Foundation đã trao tặng 2,5 triệu USD cho Alpha-Omega và OpenSSF, và 1,5 triệu USD cho Apache Software Foundation, nhằm giúp các nhà duy trì phần mềm mã nguồn mở đối phó với sự thay đổi trong bối cảnh này (những nhà duy trì quan tâm có thể đăng ký truy cập thông qua chương trình Claude for Open Source).

Chúng tôi dự định mở rộng liên tục công việc này về mặt phạm vi trong nhiều tháng, và chia sẻ càng nhiều kinh nghiệm càng tốt để các tổ chức khác cũng có thể áp dụng những kinh nghiệm đó vào hệ thống bảo mật của riêng họ. Trong phạm vi cho phép về điều kiện, các đối tác sẽ chia sẻ thông tin và thực hành tốt cho nhau; trong vòng 90 ngày, Anthropic sẽ công bố báo cáo về các phát hiện của chúng tôi, cùng với các lỗ hổng đã được sửa và các biện pháp cải tiến có thể công bố. Chúng tôi cũng sẽ hợp tác với các tổ chức an ninh hàng đầu để xây dựng một bộ khuyến nghị thực tiễn về sự tiến hóa của các thực hành an toàn trong kỷ nguyên AI, có thể bao gồm: quy trình công bố lỗ hổng, quy trình cập nhật phần mềm, an ninh mã nguồn mở và chuỗi cung ứng, vòng đời phát triển phần mềm và các thực hành thiết kế an toàn, các tiêu chuẩn trong ngành được quản lý, mở rộng phân luồng và tự động hóa, cùng với tự động hóa bản vá.

Anthropic cũng đã và đang thảo luận với các quan chức chính phủ Mỹ về năng lực mạng tấn công và phòng thủ của Claude Mythos Preview. Bảo vệ các cơ sở hạ tầng then chốt là ưu tiên an ninh quốc gia hàng đầu của các quốc gia dân chủ—sự xuất hiện của những năng lực an ninh mạng này một lần nữa cho thấy Mỹ và các đồng minh của họ cần phải duy trì vị thế dẫn đầu quyết định trong công nghệ AI. Chính phủ có vai trò không thể thiếu trong việc giúp duy trì vị thế dẫn đầu đó, cũng như trong việc đánh giá và giảm thiểu các rủi ro an ninh quốc gia liên quan đến mô hình AI. Chúng tôi mong muốn hợp tác với đại diện chính phủ ở mọi cấp để hoàn thành các nhiệm vụ này.

Chúng tôi hy vọng Project Glasswing sẽ thúc đẩy một nỗ lực quy mô lớn hơn, bao gồm cả khu vực công lẫn khu vực tư nhân, để tất cả cùng giải quyết vấn đề lớn nhất về tác động của các mô hình mạnh mẽ lên an ninh. Chúng tôi mời các thành viên khác trong ngành AI tham gia để giúp xây dựng các tiêu chuẩn của ngành. Về trung hạn, một tổ chức bên thứ ba độc lập—có thể tập hợp các tổ chức thuộc cả khu vực tư và khu vực công—có thể là nền tảng lý tưởng để đảm nhận công việc tiếp theo của các dự án an ninh mạng quy mô lớn này.

Phụ lục

  1. Dự án được đặt tên theo bướm cánh kính Greta oto (Greta oto). ẩn dụ này có hai lớp ý nghĩa: đôi cánh trong suốt của con bướm giúp nó ẩn mình vô hình, giống như những lỗ hổng được giấu trong mã mà bài viết này thảo luận; đôi cánh trong suốt cũng giúp nó tránh bị tổn thương, giống như cách tiếp cận minh bạch mà chúng tôi ủng hộ.
  2. Từ “Mythos” bắt nguồn từ tiếng Hy Lạp cổ, mang ý nghĩa “tường thuật” hoặc “câu chuyện”: hệ thống câu chuyện mà nền văn minh dùng để hiểu thế giới.
  3. Các chuyên gia bảo mật có liên quan đến công việc hợp pháp và bị ảnh hưởng bởi các biện pháp bảo vệ an ninh này có thể đăng ký chương trình xác thực an ninh mạng sắp tới (Cyber Verification Program).
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim