OpenAI đã ra mắt GPT-5.5-Cyber trong bối cảnh hạn chế của Anthropic - ForkLog

Чат-бот ChatGPT от OpenAI# OpenAI ra mắt GPT-5.5-Cyber trong bối cảnh hạn chế của Anthropic

22 tháng 6, OpenAI đã ra mắt phiên bản đầy đủ của GPT-5.5-Cyber — mô hình chuyên biệt để tìm kiếm, kiểm tra và sửa lỗi bảo mật. Việc ra mắt diễn ra trong bối cảnh hạn chế xung quanh Anthropic.

Theo tuyên bố, GPT-5.5-Cyber thuộc chương trình Daybreak và sẽ không dành cho người dùng đại trà. Mô hình dành cho các chuyên gia an ninh mạng đã được xác nhận, những người cần khả năng mạnh mẽ hơn để thực hiện các công việc bảo vệ có xác thực.

Cơ hội xuất hiện cho OpenAI

9 tháng 6, Anthropic đã mở truy cập hai phiên bản của một dòng mô hình Claude. Fable 5 được mô tả như một giải pháp thuộc loại Mythos, nhưng an toàn để sử dụng chung. Claude Mythos 5 — là mô hình cơ bản “riêng tư” với các giới hạn được nới lỏng trong một số lĩnh vực. Tuy nhiên, ngày 12 tháng 6, nhà phát triển đã tắt chúng sau khi nhận được chỉ thị từ chính phủ Mỹ trong khuôn khổ kiểm soát xuất khẩu.

Quyết định này gây ra vấn đề không chỉ cho người dùng thông thường. Ngày 23 tháng 6, công ty Legion đã đệ đơn kiện chính phủ Mỹ về chỉ thị này, theo Reuters. Tổ chức có trụ sở tại San Jose, nhưng đội ngũ phát triển của họ lại ở Canada. Theo nguồn tin, Legion cho biết việc mất quyền truy cập vào các mô hình của Anthropic đã làm gián đoạn hoạt động của các công cụ chuẩn bị tài liệu pháp lý và quản lý công việc của họ.

Trong bối cảnh đó, OpenAI đã chọn con đường khác: công ty xác nhận rằng họ đã phối hợp kiểm tra với các cơ quan liên bang của Mỹ trước, rồi mới mở GPT-5.5-Cyber chỉ cho các người dùng đã được xác thực.

GPT-5.5-Cyber có thể làm gì

Theo dữ liệu của OpenAI, GPT-5.5-Cyber đạt 85,6% trên CyberGym so với 81,8% của GPT-5.5 tiêu chuẩn. Chỉ số này tập trung vào khả năng tái tạo các lỗ hổng đã biết trong các môi trường phần mềm kiểm soát. Nó không bao gồm toàn bộ các cuộc tấn công thực tế và các kịch bản phòng thủ.

Nguồn: OpenAI. Trong blog của OpenAI cũng đề cập đến kết quả các bài kiểm tra khác. Trên ExploitGym, mô hình đạt 39,5% so với 25,95% của GPT-5.5 thông thường. Trên SEC-bench Pro — 69,8% so với 63,1%. Bài kiểm tra đầu tiên đánh giá khả năng biến một lỗ hổng đã biết thành khai thác hoạt động, bài thứ hai — tìm kiếm lỗ hổng dài hạn và tạo proof-of-concept trong các mục tiêu phần mềm phức tạp.

Nguồn: OpenAI. OpenAI nhấn mạnh rằng mục tiêu của Daybreak không chỉ là tìm ra nhiều lỗ hổng hơn, mà còn thúc đẩy việc sửa chữa chúng nhanh hơn. Theo dữ liệu của công ty, từ tháng 3, phiên bản đám mây của Codex Security đã quét hơn 30 triệu cam kết trong hơn 30.000 cơ sở mã, và các nhà đánh giá thủ công đã ghi nhận hơn 70.000 phát hiện đã được sửa.

Theo Decrypt, GPT-5.5-Cyber đã vượt qua Mythos 5 của Anthropic trên CyberGym: 85,6% so với 83,8%. Tuy nhiên, theo các đánh giá công khai khác, bức tranh phức tạp hơn. Ngày 30 tháng 4, Viện An ninh AI Vương quốc Anh (UK AI Security Institute) cho biết GPT-5.5 đã trải qua 32 bước mô phỏng cuộc tấn công doanh nghiệp The Last Ones từ đầu đến cuối trong 2 trong 10 lần thử. Mythos Preview thành công trong 3 trong 10 lần thử.

Sau đó, AISI cập nhật dữ liệu: phiên bản mới của Mythos Preview đã hoàn thành The Last Ones trong 6 trong 10 lần thử và lần đầu tiên hoàn thành kịch bản thứ hai Cooling Tower trong 3 trong 10 lần thử. GPT-5.5 trong bản cập nhật này đã hoàn thành The Last Ones trong 3 trong 10 lần thử.

Cách OpenAI hạn chế truy cập

GPT-5.5-Cyber không dành cho truy cập chung. OpenAI xác nhận rằng mô hình dành cho các người dùng đã được xác thực, những người cần khả năng bảo mật mạnh hơn và hành vi cho phép trong các kịch bản có xác thực. Đối với phần lớn khách hàng, công ty vẫn khuyên dùng GPT-5.5 với Trusted Access for Cyber và Codex Security.

OpenAI cũng đã ra mắt Chương trình Đối tác Cyber Daybreak. Trong blog của mình, công ty đã liệt kê các đối tác gồm Akamai, Check Point, Cisco, CrowdStrike, IBM, Palo Alto Networks, Proofpoint, SentinelOne, Wiz, Zscaler và các công ty khác trong lĩnh vực an ninh.

Nguồn: OpenAI. Một hướng khác là Patch the Planet, sáng kiến dành cho các dự án mã nguồn mở. Chương trình được tạo ra cùng Trail of Bits, có sự tham gia của HackerOne, các nhà nghiên cứu và nhà duy trì dự án. Các đối tác ban đầu gồm cURL, Go, Python, Sigstore và pyca/cryptography.

Trước đó, các cơ quan an ninh mạng của Mỹ, Vương quốc Anh, Canada, Australia và New Zealand đã tuyên bố rằng các mô hình AI tiên tiến có thể thay đổi khả năng tấn công và phòng thủ trong không gian mạng trong vòng vài tháng, chứ không phải nhiều năm. Theo các tác giả báo cáo, trí tuệ nhân tạo làm giảm ngưỡng vào cuộc cho các kẻ tấn công, tăng tốc các cuộc tấn công và rút ngắn khoảng thời gian giữa phát hiện lỗ hổng và khai thác.

Nhắc lại, vào tháng 6, nhóm Anthropic đã công bố trong blog hướng dẫn Claude về Zero Trust for AI agents về triển khai an toàn các đại lý AI tự động trong môi trường doanh nghiệp. Trong tài liệu, các rủi ro chính của hệ thống đại lý và phương pháp bảo mật doanh nghiệp đã được đề cập.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim