Đây là 2 giờ sáng ở London, và tôi đang thử nghiệm Claude Mythos.


Mẫu này thực sự đáng kinh ngạc, và hôm nay là lần đầu tiên tôi "cảm nhận được AGI."
Dưới đây là những suy nghĩ ban đầu của tôi về Mythos (những điểm tốt, điểm xấu, tổng quan):
Điểm tốt:
- Mô hình lập trình cực kỳ, cực kỳ thông minh. Nó thực sự đã hoàn thành toàn bộ các dự án chỉ trong một lần, khác xa bất cứ thứ gì tôi từng thấy trước đây. Cho đến nay, tôi rất ấn tượng với khả năng của Fable trong việc hoàn thành toàn bộ mã nguồn chỉ trong một lần. Bạn có thể gửi các yêu cầu và hoàn toàn yên tâm rằng Fable có thể thực thi.
- Sáng tạo. Tôi chưa thấy ai đề cập đến điều này. Fable rất sáng tạo trong thiết kế, bảng màu, và UI/UX. Lần đầu tiên tôi thích một mô hình của Anthropic hơn Gemini cho công việc thiết kế (không bằng về phần mã nguồn, nhưng rõ ràng có sự cải thiện trong thiết kế theo ý kiến của tôi).
- Chiến lược. Tôi sẽ sử dụng Fable như mô hình "cao cấp" của mình cho tất cả các suy nghĩ chiến lược (kinh doanh, mục tiêu quan trọng, v.v.). Mẫu này thực sự như đang nói chuyện với một thiên tài và đã phát hiện ra những điều tôi chưa từng nghĩ tới.
- /loops. Cách sử dụng AI mạnh nhất hiện nay là Fable + một quy trình tự động (/loop, /goal, v.v.). Tương lai của AI là để các mô hình cực kỳ thông minh này hoạt động tự chủ trong nhiều giờ liền.
Điểm xấu:
- Chi phí. Nhược điểm rõ ràng nhất. Đắt gấp đôi Opus 4.8, nghĩa là nếu bạn không có ngân sách AI riêng, có lẽ không thực tế để sử dụng Fable cho bất cứ điều gì (bạn sẽ gặp giới hạn).
- Khả dụng. Chỉ có trong các gói trả phí đến ngày 22 tháng 6; sau đó, bạn phải trả phí để truy cập API. Không thực sự ưa thích điều này.
- Chậm. Mẫu cảm giác như đang "suy nghĩ" qua từng quyết định nhỏ nhất để đưa ra kết quả tốt nhất có thể. Tôi khuyên nên dùng Opus/Sonnet cho các nhiệm vụ nhanh và chỉ dùng Fable khi thực sự cần thiết.
- Hàng rào bảo vệ. Thật phiền khi các yêu cầu bị chuyển hướng sang Opus - đặc biệt là những thứ không nguy hiểm/malicious. Một số yêu cầu của tôi mà đáng lẽ Fable phải hoàn thành đã bị chuyển hướng. Cảm giác như Anthropic cần tinh chỉnh điều này.
Tổng kết:
Tôi xem Fable như mô hình "cao cấp" của mình. Nó sẽ xử lý tất cả các nhiệm vụ cấp cao vì tôi chỉ muốn AI thông minh nhất làm việc cho các mục tiêu quan trọng nhất của mình.
Nếu trong khả năng của bạn, tôi rất khuyên bạn dành ngân sách cho AI để có thể truy cập những trí tuệ tốt nhất - đây là hướng đi của thế giới.
Fable là bước tiến lớn cho công việc tự động thực sự (chỉ cần giao nhiệm vụ cho AI và nó hoàn thành từ đầu đến cuối), và mặc dù có những điểm bất tiện, nhiều trong số đó theo tôi là điều có thể dự đoán trước.
Tổng thể, tôi ấn tượng, và thứ này cảm giác như một thiên tài trong túi tôi.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim