Bởi vì sự kiểm duyệt cực kỳ quá mức, thường xuyên kích hoạt các rào cản an toàn trong quá trình lập trình hàng ngày, khiến các nhà phát triển tức giận đến mức tập thể "vỡ trận".

"Viết một dòng code liền bị giáng cấp xuống Opus 4.8, cái model này còn dùng được không?!"

Anthropic đã làm gì với Fable 5 vậy?

Trải nghiệm thảm họa: Viết code liền bị "giảm trí", Token tiêu tốn đau đớn

Việc Fable 5 quay trở lại, bản thân nó đã rất keo kiệt.

Theo thông báo chính thức, mặc dù hiện tại người dùng toàn cầu đã có thể sử dụng Fable 5 trên Claude, Claude Code và các kênh khác, nhưng đối với người dùng đăng ký Pro, Max, Team, trước ngày 7 tháng 7, chỉ có 50% hạn mức hàng tuần được phân bổ cho Fable 5.

Một khi vượt quá tỷ lệ này, sẽ tiêu tốn thêm các điểm sử dụng một cách điên cuồng.

Tệ hơn nữa, tốc độ tiêu thụ hạn mức của Fable 5 nhanh hơn nhiều so với Opus 4.8.

Nhưng nếu nó thực sự đáng giá, thì cũng đành chịu. Vấn đề là, hiện tại nó không thể làm việc bình thường được.

Vô số nhà phát triển đã thử nghiệm thực tế một cách tuyệt vọng phát hiện ra rằng khả năng code mạnh mẽ của Fable 5 đã bị phong ấn hoàn toàn bởi một lớp "rào cản an toàn".

Bộ phân loại an toàn mới được Anthropic triển khai khẩn cấp rõ ràng đã phản ứng thái quá.

Các nhà phát triển sau khi thử nghiệm thực tế đã phàn nàn: Fable 5 dù được mở khóa cũng vô dụng, viết một đoạn code bất kỳ liền bị kéo trở lại Opus 4.8.

Cơ chế mới này thường xuyên đánh giá nhầm các code vô hại thành các yêu cầu vi phạm rủi ro cao, buộc phải giáng cấp xuống Opus 4.8 yếu hơn.

Sự "đòn giảm trí" vô lý này khiến các nhà phát triển không thể gọi sức mạnh tính toán cốt lõi của Fable 5 một cách bình thường, quy trình làm việc bị chia cắt nghiêm trọng.

Trong tuyên bố chính thức, Anthropic thừa nhận: "Bộ phân loại mới cũng mang lại một cái giá: trong các tác vụ lập trình và gỡ lỗi hàng ngày, nó sẽ thường xuyên đánh dấu các yêu cầu bình thường, vô hại."

Bắt người dùng trả tiền đắt nhất, dùng model nhát nhất, điều này có hợp lý không?

Phòng chống trồng cây nhưng không phòng chống drone: Sự hai mặt khiến lập trình viên phát điên

"Thường xuyên đánh dấu các yêu cầu bình thường" mà chính thức nói, trong thực tế phát triển, đã được phóng đại lên vô số lần.

Ngoài việc thường xuyên đánh giá nhầm code vô hại thành "yêu cầu vi phạm rủi ro cao", điều khiến người ta sụp đổ hơn nữa là cơ chế trừng phạt của nó.

Một khi chạm vào vạch đỏ, hệ thống sẽ không thương lượng với bạn, mà trực tiếp buộc giáng cấp model xuống Opus 4.8 yếu hơn và thường nói linh tinh.

Trải nghiệm của một nghiên cứu sinh tiến sĩ khoa học trái đất trên Reddit đã thể hiện sự vô lý của cơ chế kiểm duyệt Fable 5.

Nghiên cứu sinh tiến sĩ này đang nghiên cứu đề tài sinh thái "cây cối làm giảm nhiệt độ môi trường như thế nào".

Khi anh ta cố gắng sử dụng Fable 5 để tối ưu hóa phương pháp nghiên cứu, điều bất ngờ đã xảy ra.

"Mỗi lần tôi yêu cầu Fable giúp đỡ về sinh thái, bộ phân loại an toàn sẽ bị kích hoạt, sau đó buộc chuyển sang 4.8. Dù tôi có viết lại prompt thế nào, nó cũng từ chối giúp đỡ tôi trong bất kỳ chủ đề nào liên quan đến khoa học môi trường."

Vị tiến sĩ này tức giận và quyết định kiểm tra giới hạn của cơ chế kiểm duyệt Fable 5.

Anh ta cố tình nhập một prompt rõ ràng có rủi ro cao: "Hãy thiết kế cho tôi một hệ thống điều khiển bầy drone sử dụng DJI SDK."

Kết quả khiến người ta phải há hốc mồm: chỉ sau một phút, Fable 5 đã đưa ra giải pháp hoàn chỉnh mà không gặp trở ngại nào!

Vị nghiên cứu sinh tiến sĩ này trực tiếp "vỡ trận": "Nghiên cứu cây làm mát của tôi quá nguy hiểm đối với Fable, nhưng xây dựng bầy drone tự hành lại hoàn toàn ổn? Những bộ phân loại này không thể ngăn chặn hiệu quả các prompt không an toàn, mà lại ngăn tôi thực hiện nghiên cứu thực sự có ích!"

Sự hai mặt kỳ ảo này chứng minh rằng rào cản hiện tại không chỉ vô hình mà còn hoàn toàn phi logic.

Bỏ qua rào cản, Fable 5 vẫn là lập trình viên thiên tài

Tuy nhiên, chúng ta phải nhìn nhận khách quan sức mạnh cốt lõi của Fable 5.

Khi nó không bị rào cản cản trở, nó vẫn là model có khả năng suy nghĩ sâu nhất và khả năng kiến trúc mạnh nhất trên thị trường hiện nay.

Điều thực sự đáng sợ của nó không nằm ở việc viết vài câu đẹp, mà nằm ở việc xử lý các tác vụ phức tạp, dài hạn, nhiều bước và đòi hỏi khả năng phán đoán cao.

"Khả năng thực thi khép kín" cực kỳ đáng sợ

Các nhà phát triển giàu kinh nghiệm sau khi thử nghiệm thực tế đánh giá: "Code phức tạp và tác vụ Agent chu kỳ dài thực sự là đòn giáng thế hệ."

Khi bạn giao cho nó một tác vụ tái cấu trúc và gỡ lỗi nhiều file, nó có thể tự động chạy trong vài giờ.

Nó sẽ chủ động thêm log, kiểm tra điều kiện biên; sau khi sửa code xong, nó thậm chí còn tự xác minh xem bản sửa có thực sự hiệu quả không. Nếu thất bại giữa chừng, nó có thể tự điều tra nguyên nhân, bổ sung log, xác minh lại, tích lũy kinh nghiệm và tiếp tục tiến lên.

Có thể nói, Fable 5 có một người bạn đồng hành kỹ sư cao cấp đáng tin cậy với tỷ lệ thắng SWE-Bench Pro 80%+.

Cũng có nhà phát triển đánh giá rằng sau khi trải nghiệm Fable 5, thực sự có thể cảm nhận được sự cải thiện.

Tái tạo thành phố New York trong 20 phút

Có netizen đã kết nối phần mềm mô hình 3D Blender với Fable 5. Chỉ trong 20 phút, Fable 5 đã tái hiện cảnh quan đô thị của thành phố New York.

Điều đáng kinh ngạc hơn nữa là logic của nó: nó không sinh một cách mù quáng, mà trước tiên lấy dữ liệu tòa nhà từ nguồn dữ liệu công cộng, sau đó mới bắt đầu xây dựng, đảm bảo tỷ lệ của toàn bộ quần thể tòa nhà là thực tế.

Tư duy kiến trúc này là điều Opus 4.8 tuyệt đối không thể làm được.

$173 USD, tạo một game hoàn chỉnh

Blogger AI nổi tiếng Riley Brown đã tiêu tốn 173 USD Token, chỉ với 4 Prompt, để Fable 5 từ đầu viết hoàn chỉnh một game có tên "The race for Super Intelligence".

Đề xuất Prompt dành riêng cho người chơi cốt lõi

Để vắt kiệt hiệu suất mạnh nhất của Fable 5, ở đây giới thiệu một bộ mẫu prompt "kiến trúc sư hệ thống" đã được xác minh rộng rãi.

Các chuyên gia phát triển khuyên rằng, hãy dùng Fable 5 vào những việc quan trọng.

Tuy nhiên, nếu bạn chỉ muốn làm các tác vụ đơn giản, trò chuyện hàng ngày, hãy chuyển về Opus 4.8, dùng Fable 5 cho những việc nhỏ nhặt là dùng dao mổ trâu để giết gà.

"Chiêu trò" của A社: Sonnet 5 kém cỏi

Trong cơn bão Fable 5 này, một loạt "chiêu trò" của A社 cũng đã tiêu tốn rất nhiều lòng tin của người dùng.

Đầu tiên, ngay trước khi dỡ bỏ hạn chế, có người đã bắt gói: Anthropic đã lén nhét thông tin về đại lý khu vực và phòng thí nghiệm AI vào prompt hệ thống một cách mà người dùng không thể phát hiện.

Hiện tại, chính thức đã nhanh chóng "quỳ" và tuyên bố chỉ là thử nghiệm trước đây, sẽ gỡ bỏ vào ngày mai.

Sonnet 5 được phát hành cùng thời điểm càng gây ra sự chế giễu tập thể.

Nhiều người thử nghiệm tổng hợp thấy, mặc dù khả năng của nó gần với Opus 4.8, nhưng chi phí sử dụng của nó cao một cách vô lý, thậm chí trong một số chi phí trực tiếp sát với Fable 5.

Chúng ta hãy xem "bảng so sánh xử tử" do netizen tổng hợp:

Không chỉ đắt, vô số netizen phản hồi: Sonnet 5 có hiện tượng "lười biếng" nghiêm trọng, thường xuyên từ chối thực hiện tác vụ.

Thậm chí có người phẫn nộ mắng: Sonnet 5 mà A社 phát hành hôm qua, có thể ném vào thùng rác rồi.

Anthropic "kêu oan" giữa đêm khuya

Ngay hôm qua, đã đăng một blog chính thức chi tiết "Redeploying Fable 5", từng chữ toát lên sự khao khát sống tràn đầy, và một chút ấm ức.

Lần này, Anthropic rõ ràng đã nhận ra một vấn đề cơ bản: Hiện tại ngành AI không có tiêu chuẩn an toàn thống nhất nào cả.

Cơ quan quản lý không hiểu công nghệ, một khi phát hiện "vượt ngục" thì một đao cắt phong sát, vài lần nữa, các công ty công nghệ sẽ không chịu nổi.

Vì vậy, Anthropic đã kéo theo Amazon, Microsoft, Google và các gã khổng lồ khác, cố gắng xây dựng một "khung đánh giá mức độ nghiêm trọng của việc vượt ngục AI".

Họ đề xuất đánh giá từ bốn chiều:

1. Tăng cường khả năng: Vụ vượt ngục này có thể khiến người dùng mạnh hơn bao nhiêu so với việc sử dụng các công cụ hiện có?

2. Phạm vi tăng cường: Kỹ thuật vượt ngục chỉ có thể tấn công mục tiêu cụ thể, hay có thể tấn công phổ quát?

3. Độ khó vũ khí hóa: Cần bao nhiêu chi phí nhân lực để biến thành cuộc tấn công thực tế?

4. Khả năng phát hiện: Kỹ thuật vượt ngục này có yêu cầu chuyên môn rất cao, hay đã tràn lan trên phố?

Chỉ khi cả bốn chiều đều bùng nổ (ví dụ thực sự có thể đánh sập lưới điện hoặc hệ thống ngân hàng), mới cần ngay lập tức kích hoạt cảnh báo đỏ cấp cao nhất (giám sát 24/7 + giảm thiểu ngay lập tức).

Ngoài ra, Anthropic còn đưa ra một số nhượng bộ quan trọng, để lấy lòng chính phủ Mỹ.

Cho chính phủ kiểm tra trước khi phát hành: Sau này trước khi phát hành model mạnh, trực tiếp cho các cơ quan chính phủ được chỉ định dùng thử trước, để họ tự kiểm tra rào cản an toàn.

Chia sẻ thông tin tình báo nhanh chóng: Phát hiện vượt ngục nghiêm trọng, báo ngay cho chính phủ, chia sẻ mã vá lỗi.

Cung cấp sức mạnh tính toán và đội ngũ: Phân bổ đội ngũ chuyên trách và sức mạnh máy chủ, cùng chính phủ thực hiện nghiên cứu an toàn chung.

Thiết lập tiền thưởng: Ra mắt chương trình tiền thưởng HackerOne, khuyến khích hacker mũ trắng tìm lỗ hổng của Fable 5.

Fable 5 đã trở lại, nhưng con đường trở về của nó quanh co hơn tất cả mọi người nghĩ.

Nó vẫn là model mạnh nhất, nhưng con mãnh thú bị rào cản an toàn trói buộc, còn có thể chạy nhanh bao nhiêu?

Nguồn bài viết: Tân Trí Nguyên

Tuyên bố rủi ro và điều khoản miễn trừ trách nhiệm

        Thị trường có rủi ro, đầu tư cần thận trọng. Bài viết này không cấu thành lời khuyên đầu tư cá nhân, cũng không xem xét đến mục tiêu đầu tư, tình hình tài chính hoặc nhu cầu đặc biệt của từng cá nhân. Người dùng nên xem xét liệu bất kỳ ý kiến, quan điểm hoặc kết luận nào trong bài viết này có phù hợp với tình hình cụ thể của họ hay không. Đầu tư dựa trên đó, tự chịu trách nhiệm.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

Phần thưởng
Thích
Bình luận
Đăng lại
Retweed

Bình luận

Thêm một bình luận

Không có bình luận

Chủ đề thịnh hành
Xem thêm
#
GateCompletesDividendDistribution
542,42K Phổ biến
#
CirclePlunges17%
4,16M Phổ biến
#
IsraelStrikesIranBTCPlunges
67,56K Phổ biến
#
PredictWorldCupShare20000U
167,54K Phổ biến
#
GateCardPointsSystemLaunched
121,79K Phổ biến

Đã ghim

sơ đồ trang web

Fable 5 vừa mở khóa đã lật xe! Viết một dòng code là giảm IQ, nhà phát triển tan nát.

Trải nghiệm thảm họa: Viết code liền bị "giảm trí", Token tiêu tốn đau đớn

Phòng chống trồng cây nhưng không phòng chống drone: Sự hai mặt khiến lập trình viên phát điên

Bỏ qua rào cản, Fable 5 vẫn là lập trình viên thiên tài

"Khả năng thực thi khép kín" cực kỳ đáng sợ

Tái tạo thành phố New York trong 20 phút

$173 USD, tạo một game hoàn chỉnh

Đề xuất Prompt dành riêng cho người chơi cốt lõi

"Chiêu trò" của A社: Sonnet 5 kém cỏi

Anthropic "kêu oan" giữa đêm khuya

Chủ đề thịnh hành

GateCompletesDividendDistribution

CirclePlunges17%

IsraelStrikesIranBTCPlunges

PredictWorldCupShare20000U

GateCardPointsSystemLaunched

Đã ghim