#Anthropic发布Fable5模型 Một mô hình, hai tên gọi: Anthropic phát hành Fable 5 và Mythos 5, mô hình mạnh nhất lần đầu tiên mở cho công chúng
9 tháng 6, Anthropic cùng lúc ra mắt hai mô hình mới—Claude Fable 5 và Claude Mythos 5. Điều thú vị là chúng về cơ bản là cùng một mô hình nền, khác nhau chỉ ở mức "bảo vệ" và "mở rộng". Đây là lần đầu tiên mô hình có khả năng mạnh nhất trong lịch sử của Anthropic được mở cho công chúng, đồng thời cũng là một thử nghiệm "phân cấp phát hành" hiếm hoi.
Bài viết này giúp bạn hiểu rõ: nó mạnh ở điểm nào, tại sao lại đặt hai tên khác nhau, và cách sử dụng nó hiện nay.
Một, trước tiên cần rõ: mô hình "Mythos cấp" là gì?
Những người quen thuộc với Claude đều biết, các mô hình của Anthropic luôn chia thành ba cấp: Haiku (nhanh), Sonnet (cân đối), Opus (mạnh nhất). Và vào tháng 4 năm nay, Anthropic âm thầm giới thiệu một cấp mới vượt trên Opus—cấp Mythos. Mô hình Mythos đầu tiên (Claude Mythos Preview) không được bán ra công khai, mà qua một kế hoạch gọi là Project Glasswing, hợp tác với chính phủ Mỹ, chỉ cung cấp cho một số tổ chức phòng thủ mạng và nhà cung cấp hạ tầng quan trọng.
Lý do rất rõ ràng: cấp độ này quá mạnh, có thể bị lạm dụng trong các lĩnh vực tấn công mạng, nghiên cứu sinh học, nên Anthropic cho rằng không thể phát hành trực tiếp.
Hai mô hình ra mắt lần này chính là phiên bản chính thức của cấp Mythos:
◆ Claude Fable 5: Phiên bản mở cho tất cả mọi người, đi kèm một bộ "bảo vệ an toàn" mới;
◆ Claude Mythos 5: Phiên bản giảm bớt phần bảo vệ, chỉ mở cho các đối tác hợp tác như Glasswing. Cả hai đều dựa trên cùng một mô hình nền. Tên gọi cũng có ý nghĩa: Fable xuất phát từ tiếng Latin fabula ("câu chuyện kể"), cùng nguồn gốc với mythos trong tiếng Hy Lạp—cùng gốc, khác biệt chỉ ở chỗ "có thể thoải mái nói chuyện" hay không.
Hai, nó mạnh đến mức nào?
Theo lời của Anthropic, Fable 5 vượt xa mọi mô hình mà công ty từng công bố, đạt trình độ tiên tiến nhất (SOTA) trên hầu hết các chuẩn đánh giá AI, đặc biệt giỏi trong lĩnh vực kỹ thuật phần mềm, công việc tri thức, hiểu thị giác và nghiên cứu khoa học. Và càng dài, càng phức tạp, nó càng thể hiện vượt trội so với các mô hình cũ.
Viết mã: rút ngắn hai tháng thành một ngày. Công ty thanh toán Stripe trong thử nghiệm ban đầu báo cáo rằng, trong một kho mã Ruby 50 triệu dòng, Fable 5 hoàn thành toàn bộ quá trình chuyển đổi mã trong một ngày—trong kế hoạch ban đầu, cần một đội nhóm làm thủ công hơn hai tháng. Trong đánh giá FrontierCode của Cognition (nhà phát triển Devin), Fable 5 đạt điểm cao nhất trong các mô hình tiên tiến, đồng thời tiết kiệm token hơn.
Thị giác: chơi Pokémon FireRed mà không cần công cụ hỗ trợ phức tạp (bản đồ, điều hướng, trạng thái trò chơi), chỉ dựa vào hình ảnh gốc của trò chơi để vượt qua toàn bộ. Nó còn có thể từ ảnh chụp màn hình trực tiếp tái tạo mã nguồn của một ứng dụng web.
Ký ức: chơi Slay the Spire và ghi chú lại. Trong các nhiệm vụ dài hàng triệu token, Fable 5 duy trì sự tập trung liên tục, và dùng các ghi chú của chính nó để cải thiện hiệu suất. Trong thử nghiệm trò chơi thẻ bài Slay the Spire, sau khi cung cấp bộ nhớ dạng tập tin, hiệu năng tăng gấp ba lần Opus 4.8.
Nghiên cứu: tăng tốc thiết kế thuốc khoảng 10 lần. Các chuyên gia thiết kế protein nội bộ của Anthropic dùng Mythos 5 để rút ngắn quy trình thiết kế thuốc khoảng mười lần—mô hình tự độc lập hoàn thành các bước chọn vị trí liên kết, chạy công cụ thiết kế protein, phục hồi sau thất bại, những bước thường do nhà khoa học thực hiện. Trong 14 mục tiêu protein, có 9 mục đã cho ra các ứng viên thuốc tiềm năng để tiếp tục nghiên cứu. Nó còn đề xuất một giả thuyết mới về cơ chế protein của E. coli, sau đó được một phòng thí nghiệm độc lập xác nhận.
Ba, cách hoạt động của "bảo vệ": kích hoạt sẽ "hạ cấp" về Opus 4.8
Đây là điểm thiết kế thú vị nhất trong toàn bộ phát hành. Fable 5 đi kèm một bộ phân loại an toàn mới—một hệ thống AI độc lập ngoài mô hình chính, chuyên phát hiện các khả năng lạm dụng tiềm ẩn. Khi bộ phân loại này cho rằng yêu cầu của bạn liên quan đến ba lĩnh vực nhạy cảm sau, câu trả lời sẽ không còn là Fable 5 nữa, mà tự động chuyển sang mô hình mạnh thứ hai là Claude Opus 4.8 (người dùng sẽ nhận được thông báo):
1. An ninh mạng: Mythos rất giỏi phát hiện và khai thác lỗ hổng phần mềm, còn có khả năng "tấn công hacker tự động"—quét, di chuyển ngang, toàn bộ chuỗi. Những khả năng này làm giảm đáng kể chi phí tấn công mạng, nên được đặc biệt chú ý phòng ngừa.
2. Sinh học và Hóa học: mô hình đã có thể hoàn thành các nhiệm vụ nghiên cứu thực tế (ví dụ dự đoán cấu trúc virus), khả năng này rất nguy hiểm nếu rơi vào tay kẻ xấu, nên hầu hết yêu cầu trong lĩnh vực sinh hóa đều sẽ bị chuyển sang Opus.
3. Tấn công phân tán: ngăn chặn việc "rút trộm" quy mô lớn khả năng của Fable 5 để huấn luyện các mô hình cạnh tranh.
Một số con số quan trọng: phần lớn các cuộc trò chuyện (trung bình dưới 5%) sẽ kích hoạt bộ phân loại, nghĩa là hơn 95% người dùng vẫn sử dụng gần như toàn bộ khả năng của Mythos 5. Anthropic thừa nhận rằng bộ phân loại còn khá bảo thủ, dễ gây nhầm lẫn với các yêu cầu vô hại, và sẽ cố gắng giảm thiểu các báo động sai. Về khả năng vượt tường, trong hơn 1000 giờ thử nghiệm bẫy lỗi từ bên ngoài, chưa phát hiện "lỗ hổng toàn diện".
Một điểm đáng chú ý khác: tất cả lưu lượng của mô hình Mythos cấp sẽ bị giữ lại trong 30 ngày (kể cả khách doanh nghiệp), để phòng chống các cuộc tấn công mới và vượt tường—Anthropic cam kết dữ liệu này không dùng để huấn luyện, đồng thời trang bị các biện pháp bảo vệ quyền riêng tư như kiểm tra truy cập.
Bốn, Mythos 5: phiên bản không có bảo vệ dành cho "cộng đồng tin cậy"
Mythos 5 chính là Fable 5 đã bỏ bớt phần bảo vệ, tự hào có khả năng an ninh mạng mạnh nhất toàn cầu. Hiện chỉ qua Project Glasswing, dành cho các tổ chức phòng thủ mạng, như một bản nâng cấp của Mythos Preview. Trong tương lai, Anthropic dự kiến mở rộng dần: đàm phán với chính phủ Mỹ để tăng số đối tác; ra mắt chương trình truy cập tin cậy hệ thống hơn, cho phép các tổ chức an ninh mạng đăng ký; và mở rộng cho các nhà nghiên cứu y sinh, với một chương trình tin cậy sinh học (bỏ phần bảo vệ sinh hóa, giữ phần bảo vệ an ninh mạng), nhằm thúc đẩy phát triển liệu pháp mới. Cách "cùng một mô hình, phân cấp theo danh tính mở khóa" này là lần đầu tiên trong lịch sử phát hành AI tiên tiến.
Năm, giá cả và cách bắt đầu: trước ngày 22 tháng 6 là "giai đoạn miễn phí"
Giá API trong thời gian này: nhập $10 / triệu token, xuất $50 / triệu token—ít hơn một nửa so với Mythos Preview. Định danh mô hình là claude-fable-5, API và các gói doanh nghiệp theo lượng sẽ chính thức hoạt động từ hôm nay. Người đăng ký cần chú ý lịch trình:
◆ Từ nay đến 22 tháng 6: các gói Pro, Max, Team và doanh nghiệp đều miễn phí bao gồm Fable 5;
◆ Từ 23 tháng 6: sẽ bị loại khỏi các gói, muốn tiếp tục dùng phải mua điểm sử dụng; nếu đủ khả năng, có thể gia hạn miễn phí;
◆ Sau đó: khi đủ năng lực tính toán, Anthropic dự định đưa Fable 5 trở lại các gói đăng ký tiêu chuẩn. Nói cách khác, hai tuần tới là thời gian trải nghiệm miễn phí mô hình mạnh nhất, độc giả quan tâm nên tranh thủ thử.
Sáu, kết luận: "Giải pháp mới" cho khả năng và an toàn
Trong vài năm qua, các phòng thí nghiệm tiên tiến chỉ có hai lựa chọn khi "mô hình quá mạnh": hoãn phát hành hoặc giảm khả năng. Anthropic lần này đưa ra một lựa chọn thứ ba—phát hành toàn bộ, nhưng trang bị "bảo vệ động" cho phiên bản công khai; đồng thời giữ lại bản đầy đủ cho các tổ chức tin cậy.
Phương án này không hoàn hảo: 5% các trường hợp nhầm lẫn có thể gây thất vọng cho một số người dùng chuyên nghiệp (đặc biệt là các nhà nghiên cứu an ninh và sinh học), và việc giữ dữ liệu trong 30 ngày có thể gây tranh cãi về quyền riêng tư. Nhưng nó thực sự giúp "mạnh nhất" lần đầu tiên không bị khóa trong các dự án hợp tác chính phủ, mà có thể vào đối thoại của mọi người theo cách kiểm soát được. Khi AI có thể hoàn thành công việc của nhóm hai tháng trong một ngày, và tự thiết kế các thuốc protein tiềm năng, thì "cách phát hành" đã trở thành một phần quan trọng không kém "làm ra sản phẩm". Từ "Fable" và "Mythos" cùng nguồn gốc có thể trở thành mẫu tham khảo cho tất cả các mô hình tiên tiến trong tương lai.