Anthropic ra mắt Fable 5 với khóa an toàn mở khóa khả năng Mythos cấp độ

Tác giả: Lý Đan, Huàěrjiē Jiànwén

Trong lúc chuẩn bị IPO, Anthropic đã tung ra sản phẩm đột phá.

Vào ngày thứ Ba, 9 tháng 5 theo giờ Đông Mỹ, Anthropic chính thức ra mắt Claude Fable 5, đồng thời giới thiệu Claude Mythos 5. Cả hai dựa trên cùng một kiến trúc mô hình nền tảng, trong đó Fable 5 là mô hình Mythos đầu tiên mở cho công chúng, còn Mythos 5 giữ lại khả năng đầy đủ hơn, hiện chỉ mở cho một số tổ chức đáng tin cậy.

Anthropic cho biết, Fable 5 đã trở thành mô hình mạnh nhất mà công ty công bố đến nay, đạt trình độ hàng đầu trong nhiều lĩnh vực như kỹ thuật phần mềm, nghiên cứu khoa học, phân tích tài chính, hiểu biết hình ảnh. Điều này có nghĩa là, công nghệ Mythos từng bị hạn chế truy cập do khả năng phòng thủ mạng mạnh mẽ, cuối cùng đã bắt đầu hướng tới thị trường đại chúng.

Tuy nhiên, Anthropic vẫn thực hiện các biện pháp “hạ quyền hạn” nghiêm ngặt đối với Fable 5: các câu hỏi liên quan đến an ninh mạng, sinh học và hóa học nhạy cảm sẽ tự động chuyển sang xử lý bằng Claude Opus 4.8 có khả năng yếu hơn, nhằm giảm thiểu rủi ro lạm dụng.

Giá của Fable 5 và Mythos 5 là 10 USD/triệu token đầu vào và 50 USD/triệu token đầu ra. Anthropic chỉ ra rằng mức giá này chưa bằng một nửa bản xem trước Claude Mythos, đồng thời cho biết việc ra mắt mô hình mới đánh dấu bước tiến gần hơn tới mục tiêu đã đề ra, đó là mang khả năng AI tiên tiến đến càng nhiều người dùng càng tốt một cách nhanh chóng và an toàn.

Đối với Anthropic đang chuẩn bị IPO, đây không chỉ là một nâng cấp mô hình mà còn là một màn trình diễn “sức mạnh” trên thị trường vốn, thể hiện khả năng vừa phát triển AI tiên tiến nhất, vừa kiểm soát rủi ro.

Mô hình “Tiên tiến nhất” Fable 5 của Anthropic mạnh đến mức nào?

Theo định nghĩa của Anthropic, Fable 5 là mô hình Mythos đầu tiên “có thể triển khai an toàn công khai”.

Anthropic cho biết, Fable 5 đạt trình độ hàng đầu trong gần như tất cả các tiêu chuẩn kiểm thử, đặc biệt thành thạo các nhiệm vụ dài hạn, nhiều bước, độ phức tạp cao. Anthropic nhấn mạnh: “Nhiệm vụ càng dài, càng phức tạp, lợi thế của Fable 5 so với các mô hình khác càng rõ rệt.”

Phát triển phần mềm là một trong những khả năng nổi bật nhất của nó.

Trong thử nghiệm ban đầu, gã khổng lồ thanh toán Stripe phát hiện rằng, trong một kho mã lớn gồm 50 triệu dòng Ruby, Fable 5 chỉ mất một ngày để hoàn thành một công việc di chuyển mã vốn cần tới hai tháng của một nhóm phát triển.

Trong lĩnh vực tài chính và công việc trí tuệ, Anthropic dẫn lời các đánh giá của bên thứ ba cho biết, Fable 5 đạt điểm cao nhất trong các nhiệm vụ suy luận tài chính nâng cao, phân tích tài liệu, hiểu biểu đồ và bảng biểu. Tổ chức giao dịch IMC cũng cho biết, mô hình này thể hiện xuất sắc trong truy xuất thông tin, phân tích nguyên nhân gốc rễ, suy luận khái niệm và phân tích lợi nhuận kỳ vọng.

Khả năng thị giác cũng được nâng cao rõ rệt.

Anthropic nói rằng, Fable 5 có thể trích xuất dữ liệu chính xác từ các biểu đồ nghiên cứu phức tạp, thậm chí tái tạo mã nguồn ứng dụng web chỉ dựa trên ảnh chụp màn hình. Trong một thử nghiệm nội bộ, mô hình chỉ dựa vào dữ liệu hình ảnh để hoàn thành vượt qua trò chơi Pokémon FireRed, trong khi phiên bản Claude trước đó cần thêm công cụ hỗ trợ để làm điều này.

Ngoài ra, Fable 5 còn nâng cao khả năng duy trì ngữ cảnh dài và ghi nhớ liên tục. Anthropic cho biết, mô hình có thể duy trì sự tập trung trong các nhiệm vụ dài hàng triệu token, đồng thời sử dụng ghi chú của chính nó để tối ưu hóa kết quả đầu ra.

Mythos 5 mạnh hơn, nhưng công chúng vẫn chưa thể dùng trực tiếp

Cùng với Fable 5, còn có Mythos 5 – sản phẩm được chú ý đặc biệt.

Anthropic tiết lộ, hai sản phẩm thực chất dựa trên cùng một mô hình nền tảng, nhưng Mythos 5 đã loại bỏ một số giới hạn an toàn, do đó giữ lại khả năng toàn diện hơn về an ninh mạng và nghiên cứu khoa học.

Anthropic dự kiến, Mythos 5 chỉ mở cho một số tổ chức qua sáng kiến đặc biệt mang tên Project Glasswing, gồm các cơ quan chính phủ Mỹ, nhà vận hành hạ tầng quan trọng và tổ chức phòng thủ mạng.

Anthropic tuyên bố, mô hình này sở hữu “khả năng an ninh mạng mạnh nhất thế giới”, trong tương lai sẽ dần mở rộng qua “Chương trình Truy cập Tin cậy” (Trusted Access Program).

Trong lĩnh vực khoa học đời sống, Anthropic còn tiết lộ một số kết quả thử nghiệm đáng chú ý.

Anthropic nói rằng, Mythos 5 đã có thể tự thực hiện quy trình thiết kế protein, đạt hoặc vượt trình độ của các nhà nghiên cứu chuyên nghiệp trong một số nhiệm vụ phát triển thuốc. Nhóm nghiên cứu của Anthropic còn cho biết, một giả thuyết mới về cơ chế của protein E. coli do mô hình đề xuất đã được xác nhận qua kết quả nghiên cứu của phòng thí nghiệm độc lập.

Từ việc quá nguy hiểm không thể công khai đến thương mại chính thức, Mythos đã trải qua những gì?

Điều đáng chú ý nhất trong lần ra mắt này là Anthropic cuối cùng đã giải quyết được vấn đề cốt lõi cản trở Mythos công khai triển khai.

Vào đầu năm nay, khi lần đầu giới thiệu Mythos Preview, Anthropic đã gây chấn động ngành. Công ty hiếm hoi cảnh báo rằng, mô hình này có thể phát hiện và khai thác lỗ hổng phần mềm trong các hệ điều hành và trình duyệt chính, thể hiện khả năng phòng thủ mạng chưa từng có, nên quyết định chưa mở cho công chúng.

Quyết định này cực kỳ hiếm trong ngành AI.

Thông thường, các công ty AI thích mở rộng mô hình càng nhanh càng tốt, nhưng Anthropic lại chọn hạn chế truy cập chủ động, chỉ cho một số đối tác thử nghiệm. Trước đó, Project Glasswing đã bao gồm khoảng 50 tổ chức, gần đây thêm 150 tổ chức nữa, tổng cộng gần 200.

Để thúc đẩy việc phát hành công khai, Anthropic đã bổ sung nhiều lớp cơ chế an toàn cho Fable 5.

Khi hệ thống phát hiện các yêu cầu nhạy cảm liên quan đến an ninh mạng, sinh học, hóa học và phân phối mô hình, người dùng thực chất nhận được câu trả lời của Claude Opus 4.8, chứ không phải của Fable 5. Công ty cho biết, tỷ lệ kích hoạt các giới hạn này là dưới 5%.

Anthropic còn tiến hành hơn 1000 giờ “kiểm tra vượt tường lửa” (Jailbreak Testing), nhằm tìm cách vượt qua các giới hạn an toàn. Công ty cho biết, các nhân viên thử nghiệm không tìm ra phương pháp phá vỡ hệ thống bảo vệ chung nào có thể áp dụng rộng rãi.

Mục tiêu then chốt trước IPO: Anthropic cố gắng chứng minh khả năng và an toàn cùng lúc

Về mặt thương mại, việc ra mắt Fable 5 và Mythos 5 đúng vào giai đoạn phát triển quan trọng nhất của Anthropic.

Cuối tháng 5, Anthropic hoàn tất khoản huy động 6,5 tỷ USD, định giá sau phát hành đạt 96,5 tỷ USD, vượt qua OpenAI trở thành một trong những startup AI có giá trị cao nhất thế giới. Sau đó, vào đầu tháng 6, công ty bí mật nộp hồ sơ xin IPO, chuẩn bị cho việc niêm yết có thể diễn ra trong mùa thu này.

Thị trường luôn quan tâm một câu hỏi: Liệu Anthropic có thể biến khả năng nghiên cứu hàng đầu thành sản phẩm thương mại quy mô lớn?

Dù Mythos từng được xem là AI an ninh mạng tiên tiến nhất thế giới, nhưng do rủi ro an toàn, chưa thể triển khai rộng rãi, giá trị thương mại của nó bị hạn chế. Giờ đây, việc ra mắt Fable 5 như một giải pháp trung dung – giữ lại phần lớn khả năng tiên tiến, đồng thời qua các cơ chế định tuyến động và kiểm soát quyền hạn, đáp ứng yêu cầu an toàn.

Đối với các nhà đầu tư tiềm năng, mô hình này mang ý nghĩa quan trọng.

Một mặt, Anthropic chứng minh năng lực công nghệ vẫn đứng đầu ngành; mặt khác, còn thể hiện lợi thế khác biệt trong quản trị mô hình và kiểm soát rủi ro, chính là những khả năng ngày càng được các cơ quan quản lý và thị trường vốn quan tâm.

Cùng lúc, công ty còn nâng giá các mô hình cao cấp. Giá của Fable 5 và Mythos 5 là 10 USD/triệu token đầu vào, 50 USD/triệu token đầu ra, gấp đôi Opus 4.8, nhưng Anthropic tin rằng hiệu suất cao hơn sẽ bù đắp phần nào chi phí.

Khi IPO đến gần, Anthropic đang kể cho thị trường một câu chuyện mới: không chỉ sở hữu một trong những mô hình AI mạnh nhất, mà còn có thể cân bằng giữa an toàn, quy định và thương mại hóa. Và Fable 5 chính là sản phẩm trung tâm mới nhất của câu chuyện này.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim