Anthropic sẽ khôi phục quyền truy cập vào Fable 5 sau khi Hoa Kỳ dỡ bỏ các hạn chế - ForkLog

ии-стартап Anthropic AI# Anthropic sẽ khôi phục quyền truy cập vào Fable 5 sau khi Hoa Kỳ dỡ bỏ hạn chế

Bộ Thương mại Hoa Kỳ đã dỡ bỏ các hạn chế xuất khẩu đối với các mô hình Claude Fable 5 và Claude Mythos 5. Điều này đã được nhóm Anthropic thông báo vào ngày 30 tháng 6.

We’ve received notice that the Department of Commerce has lifted export controls on Claude Fable 5 and Mythos 5.

We'll begin restoring access tomorrow, and will share an update soon.

We’re grateful to our users for their patience, and to everyone who worked with us on…

— Anthropic (@AnthropicAI) June 30, 2026

Công ty sẽ mở lại Fable 5 cho người dùng trên toàn thế giới từ ngày 1 tháng 7. Mô hình này sẽ có sẵn trên Claude Platform, Claude.ai, Claude Code và Claude Cowork. Khả năng hoạt động thông qua AWS, Google Cloud và Microsoft Foundry sẽ được khôi phục "càng nhanh càng tốt", Anthropic tuyên bố.

Claude Fable 5 will be available again globally tomorrow.

After a series of productive conversations with the US government, we're redeploying the model with a new set of classifiers to target and block more cybersecurity tasks. In the near term, some routine tasks like coding…

— Anthropic (@AnthropicAI) July 1, 2026

*«*Sau một loạt các cuộc đối thoại hiệu quả với chính phủ Hoa Kỳ, chúng tôi đang triển khai lại mô hình với một bộ phân loại mới để nhắm mục tiêu và chặn chính xác hơn các nhiệm vụ liên quan đến an ninh mạng. […] Chúng tôi cũng đã bắt đầu phát triển một khuôn khổ đồng thuận — cùng với Amazon, Microsoft, Google và các đối tác khác của Glasswing — để đánh giá mức độ nghiêm trọng của các vụ hack AI và xác định cách các nhà phát triển AI nên phản ứng với chúng», — bài đăng cho biết.

Quyền truy cập vào Mythos 5 đã được khôi phục cho một số tổ chức Hoa Kỳ sau khi được chính phủ phê duyệt vào ngày 26 tháng 6. Công ty sẽ tiếp tục hợp tác với chính quyền. Theo đại diện của Anthropic, điều này sẽ bao gồm quyền truy cập trước khi phát hành vào các công cụ và biện pháp bảo vệ để đánh giá, chia sẻ thông tin về các vụ hack và lạm dụng, cũng như các nguồn lực dành riêng cho nghiên cứu chung.

Để khôi phục Fable 5, các nhà phát triển đã huấn luyện một bộ phân loại bảo mật mới: nó sẽ hạn chế hành vi được mô tả trong báo cáo của Amazon gửi tới chính quyền. Nếu yêu cầu bị chặn, người dùng sẽ nhận được thông báo và yêu cầu đó sẽ được chuyển hướng sang Claude Opus 4.8. Theo dữ liệu của công ty, bộ phân loại mới phát hiện phương pháp cụ thể trong hơn 99% trường hợp.

«Có lẽ không thể làm cho bất kỳ mô hình AI nào hoàn toàn chống lại việc jailbreak», — Anthropic tuyên bố.

Công ty thừa nhận rằng các biện pháp mới sẽ dẫn đến nhiều kết quả dương tính giả hơn trong các tác vụ lập trình và gỡ lỗi thông thường. Nhóm cho rằng đây là sự đánh đổi để có quyền truy cập rộng rãi hơn vào các khả năng còn lại của mô hình.

Bên cạnh đó, Anthropic cùng với Amazon, Microsoft, Google và các đối tác khác của Project Glasswing đã bắt đầu phát triển một cách tiếp cận chung để đánh giá mức độ nguy hiểm của các vụ jailbreak. Công ty chỉ ra rằng hiện tại trong ngành AI không có tiêu chuẩn thống nhất nào để xác định mức độ nghiêm trọng của các biện pháp vượt rào bảo vệ này.

Sơ đồ được đề xuất đánh giá jailbreak dựa trên bốn tiêu chí:

  • mức độ nó mở rộng khả năng của kẻ tấn công so với các công cụ có sẵn;
  • số lượng nhiệm vụ độc hại khác nhau mà biện pháp vượt rào lan tới;
  • mức độ dễ dàng biến nó thành một cuộc tấn công thực tế;
  • mức độ dễ dàng để người khác tìm thấy hoặc lặp lại phương pháp này.

Đối với các trường hợp nguy hiểm nhất, công ty hứa sẽ bắt đầu các biện pháp bảo vệ sơ bộ ngay sau khi xác nhận mức độ nghiêm trọng của mối đe dọa. Anthropic cũng đang thành lập một nhóm giám sát 24/7 các kênh nơi công bố dữ liệu về jailbreak và ra mắt chương trình HackerOne để báo cáo về các biện pháp vượt rào bảo vệ có thể có của Fable 5.

Xin nhắc lại, vào tháng 6, trong bối cảnh các hạn chế đối với Anthropic, OpenAI đã ra mắt phiên bản đầy đủ của mô hình chuyên biệt dành cho việc tìm kiếm, kiểm tra và sửa lỗi bảo mật GPT-5.5-Cyber.

Vào cuối tháng, theo yêu cầu của chính quyền Hoa Kỳ, công ty đã mở quyền truy cập hạn chế vào GPT-5.6 Sol, Terra và Luna cho một nhóm nhỏ các đối tác đáng tin cậy.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim