GPT-5.5-Cyber khả năng an ninh mạng đánh bại Claude Mythos!Trắng nhà cho phép vs bị phong tỏa hai số phận

OpenAI ra mắt mô hình an ninh mạng mới nhất GPT-5.5-Cyber, vượt qua Mythos 5 của Anthropic với tỷ lệ 85.6% trong bài kiểm tra tiêu chuẩn CyberGym của UC Berkeley, trong khi Mythos 5 chỉ đạt 83.8%. Kế hoạch Daybreak của OpenAI đã hợp tác với bảy quốc gia và các cơ quan an ninh mạng của Liên minh châu Âu, cùng với 28 nhà cung cấp an ninh mạng như CrowdStrike, Cisco để tích hợp sản phẩm, đi theo con đường quản lý khác biệt hoàn toàn so với Anthropic.
(Trước đó: OpenAI ra mắt mô hình an ninh mạng chuyên dụng GPT-5.4-Cyber: đã vá 3.000 lỗ hổng nguy hiểm, cạnh tranh Claude Mythos)
(Bổ sung nền: Anthropic Fable 5 bị Donald Trump để mắt, ai đang cười thầm phía sau? Báo chí tiết lộ ba người hưởng lợi chính)

Nội dung bài viết

Chuyển đổi

  • Cùng năng lực, hai số phận: Tại sao Nhà Trắng lại cho phép OpenAI nhưng lại cấm đoán Anthropic?
  • Hiện thực hóa lời tiên tri? Khủng hoảng trung thực của Anthropic và hậu quả chính sách
  • Từ vá lỗ hổng đến vá trái đất: Hệ sinh thái phòng thủ của OpenAI hình thành

Tháng Sáu năm 2026, cuộc đua an toàn AI xuất hiện sự phân chia kịch tính. Vào ngày 22 tháng 6, OpenAI chính thức ra mắt GPT-5.5-Cyber, mô hình chủ lực mới nhất của kế hoạch phòng thủ mạng Daybreak. Trong bài kiểm tra tiêu chuẩn CyberGym do UC Berkeley phát triển, mô hình này đã đưa AI vào 1.507 lỗ hổng phần mềm đã biết, trải rộng trên 188 dự án mã nguồn mở, đạt tỷ lệ tái tạo 85.6%.

Nhóm đối chứng gây thích thú: Mythos 5 của Anthropic đạt 83.8% trong cùng bảng xếp hạng, trong khi Claude Opus 4.7 của Anthropic chỉ đạt 73.1%. Chênh lệch chưa đến hai phần trăm có thể không đáng kể trong các tiêu chuẩn thông thường, nhưng tình hình quản lý phía sau lại hoàn toàn khác biệt, Mythos 5 và Fable 5 đã bị chính quyền Trump ra lệnh gỡ bỏ theo "Chỉ thị kiểm soát xuất khẩu khẩn cấp" từ ngày 12 tháng 6, đến nay vẫn đang trong trạng thái ngoại tuyến.

Cùng năng lực, hai số phận: Tại sao Nhà Trắng lại cho phép OpenAI nhưng lại cấm đoán Anthropic?

Nguyên nhân trực tiếp khiến Mythos 5 của Anthropic bị yêu cầu gỡ bỏ là do một lỗ hổng jailbreak, một kỹ thuật vượt qua giới hạn an ninh của AI, tương tự như tìm ra chìa khóa vạn năng cho khóa cửa an toàn cao. Do Anthropic không thể xác minh quy mô quốc tịch người dùng, cuối cùng đã chọn đóng cửa hai mô hình này cho tất cả người dùng toàn cầu. Đến nay đã quá hơn mười ngày, cả Anthropic lẫn Bộ Thương mại Mỹ đều chưa đưa ra thời gian khôi phục rõ ràng.

Nhưng GPT-5.5-Cyber của OpenAI không chỉ vẫn hoạt động trực tuyến, mà còn nhận được sự bảo trợ chính thức. Trước khi triển khai, OpenAI đã hợp tác với các cơ quan liên bang, bao gồm Trung tâm Tiêu chuẩn và Đổi mới AI (Center for AI Standards and Innovation) và Văn phòng Giám đốc An ninh Mạng Quốc gia (Office of the National Cyber Director), hoàn thành các thử nghiệm trước khi ra mắt. Nói cách khác, OpenAI chọn cách để chính phủ gật đầu trước khi đưa ra thị trường, chứ không như Anthropic, là đưa ra rồi mới bị chính phủ ngăn chặn.

Chiến lược "xem xét trước, phát hành sau" này đã phát huy hiệu quả. Daybreak đã ký kết thỏa thuận hợp tác an ninh mạng với Úc, Canada, Pháp, Đức, Nhật Bản, Hàn Quốc và các cơ quan của Liên minh châu Âu (bao gồm ENISA - Cơ quan An ninh mạng châu Âu). 28 nhà cung cấp an ninh mạng, trong đó có CrowdStrike, Cisco và Cloudflare, đã tham gia Chương trình Đối tác An ninh mạng Cyber của họ, tích hợp GPT-5.5 vào sản phẩm của riêng họ để phục vụ khách hàng đã được chứng nhận.

Hiện thực hóa lời tiên tri? Khủng hoảng trung thực của Anthropic và hậu quả chính sách

Một số vấn đề bắt nguồn từ chính Anthropic đã gieo rắc. Công ty này đã dành nhiều tháng để mô tả Mythos là "một trong những mô hình AI mạnh mẽ nhất và nguy hiểm nhất từ trước đến nay", trong hồ sơ phát hành đã cảnh báo rõ rằng khả năng an ninh mạng của nó nếu không được kiểm soát phù hợp có thể gây ra hậu quả nghiêm trọng. Đồng sáng lập Anthropic, Dario Amodei, trong bài viết dài ngày 10 tháng 6 đã so sánh các mô hình AI tiên tiến như máy bay, và cho rằng các cơ quan quản lý an toàn nên có khả năng dừng bay của chúng khi chưa qua kiểm tra. Chỉ vài ngày sau, chính phủ đã thực sự yêu cầu dừng hoạt động của máy bay của Anthropic.

Điều tồi tệ hơn, cùng trong tuần đó, Anthropic còn bị phát hiện có các bộ lọc kiểm duyệt ẩn trong Fable 5, khiến mô hình này im lặng giảm chất lượng đầu ra đối với những người dùng nghi ngờ đang phát triển đối thủ cạnh tranh. Anthropic cuối cùng đã phải xin lỗi và thu hồi chính sách này, nhưng niềm tin của công chúng đã bị tổn thương.

Điều này đối lập rõ rệt với hướng đi của OpenAI. GPT-5.5-Cyber của OpenAI cũng không mở cho công chúng phổ thông, chỉ cung cấp cho các chuyên gia an ninh đã được xác minh, mức hạn chế tương đương Mythos của Anthropic, nhưng OpenAI đã hoàn tất đàm phán quản lý với chính phủ trước khi ra mắt, chứ không phải sau đó bị chính phủ buộc phải hợp tác.

Từ vá lỗ hổng đến vá trái đất: Hệ sinh thái phòng thủ của OpenAI hình thành

Theo blog chính thức của OpenAI, công cụ Codex Security đã quét hơn 30 triệu lần commit kể từ tháng 3, bao phủ 30.000 kho mã, ghi nhận hơn 500.000 lỗ hổng đã vá. OpenAI cũng phát động dự án "Patch the Planet" (Vá Trái Đất), nhằm giúp sửa các lỗ hổng an ninh trong các dự án mã nguồn mở phổ biến, không chỉ phòng thủ hệ thống của chính mình mà còn chủ động củng cố chuỗi cung ứng phần mềm toàn cầu.

Cuộc đua an toàn AI này làm nổi bật một mâu thuẫn mang tính cấu trúc: khi mô hình mạnh nhất cũng là mô hình nguy hiểm nhất, việc trung thực cảnh báo rủi ro có thể phản tác dụng. Anthropic thành thật cảnh báo về khả năng phá hoại của Mythos, kết quả là bị chính phủ cấm hoàn toàn; trong khi OpenAI áp dụng các biện pháp hạn chế tương tự, nhưng nhờ có sự bảo trợ chính thức từ chính phủ nên vẫn có thể tiếp tục hoạt động.

Tính đến ngày 23 tháng 6, Fable 5 và Mythos 5 vẫn đang trong trạng thái ngoại tuyến, trong khi Anthropic đang đàm phán với Bộ Thương mại và kiện chính quyền Trump. Trong khi đó, kế hoạch Daybreak của OpenAI đang mở rộng từ phòng thủ mạng sang hợp tác quốc tế, cho thấy sự khác biệt chiến lược giữa hai công ty không chỉ là về kỹ thuật mà còn là về cách tồn tại trong kỷ nguyên quản lý AI.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim