Lofli: Sau vụ khóa đăng ký Claude và hạn chế truy cập vào Lobster, con đường thực sự không phải là token rẻ hơn

robot
Đang tạo bản tóm tắt

(Nguồn: Máy móc Chi Tâm)

Bộ phận biên tập Máy móc Chi Tâm

Thời đại Agent, chúng ta cần triết lý đúng đắn về tính phí và thiết kế kỹ thuật. Đây là quan điểm mà người phụ trách các mô hình lớn Xiaomi MiMo, Luo Fuli, vừa chia sẻ trên X.

Vài ngày trước, chúng tôi đã đưa tin về một sự kiện — Anthropic tuyên bố rằng, kể từ ngày hôm nay, người dùng đăng ký Claude Pro và Max sẽ không còn được dùng hạn mức đăng ký để sử dụng các khung Agent bên thứ ba như OpenClaw nữa. Muốn tiếp tục dùng? Thì phải chuyển sang thanh toán API theo mức sử dụng. Điều này khiến nhiều người dùng Claude vốn chơi “con tôm” theo mô hình đăng ký lập tức bàng hoàng.

Giải thích chính thức của Anthropic cho biết: mô hình định giá theo đăng ký ban đầu được thiết kế dựa trên “cường độ sử dụng thông thường của người dùng cá nhân”, nhưng việc sử dụng các công cụ agent tự động như OpenClaw lại vượt xa dự đoán — một số người dùng nặng mỗi tháng chỉ trả 200 đô tiền phí đăng ký nhưng lại tiêu tốn tài nguyên điện toán trị giá 5000 đô, gây áp lực chi phí rất lớn lên Anthropic.

Tin vừa được công bố, phản ứng của các bên không giống nhau. Có người la lên “bị đâm sau lưng”, cho rằng mô hình đăng ký mất ngay sức hấp dẫn; cũng có người vỗ tay khen hay, cho rằng đây là việc dọn dẹp việc sử dụng kém hiệu quả, bảo vệ tính bền vững của toàn nền tảng.

Dù là tiếng nói nào đi nữa, vấn đề cốt lõi đều đã lộ ra: hiện nay mô hình tính phí theo token đã rất khó để đối phó với thách thức, và chúng ta cần một cách sử dụng điện toán thông minh hơn, bền vững hơn.

Trong bài đăng, Luo Fuli trước hết chỉ ra rằng: mô hình đăng ký của Anthropic vốn dĩ chạy đang bị lỗ.

Chế độ đăng ký của Claude Code là một hệ thống phân bổ cân bằng tài nguyên điện toán được thiết kế rất tinh xảo. Nhận định của tôi là — rất có khả năng nó không kiếm được tiền, thậm chí còn có thể đang lỗ, trừ khi họ có biên lợi nhuận API cao gấp 10-20 lần, nhưng tôi nghi ngờ điều đó. Tôi không thể tính chính xác mức lỗ do việc tích hợp các khung bên thứ ba gây ra, nhưng tôi đã xem gần OpenClaw về quản lý context — nó viết rất kém. Trong phạm vi một yêu cầu của người dùng, nó sẽ kích hoạt nhiều vòng gọi công cụ có giá trị thấp; mỗi lần đều phát ra như một yêu cầu API độc lập, và mỗi lần đều kèm một cửa sổ context rất dài (thường vượt quá 100k token) — dù có cache hit vẫn cực kỳ lãng phí; trong trường hợp cực đoan còn có thể làm tăng tỷ lệ cache miss của các yêu cầu khác.

Quy đổi lại, số lần gọi API thực tế mà mỗi yêu cầu người dùng kích hoạt là gấp nhiều lần so với chính framework của Claude Code. Quy đổi sang giá API, chi phí thực tế có lẽ khoảng vài chục lần giá đăng ký. Đây không phải là khác biệt — đây là một cái bẫy.

Về “nỗi đau” của người dùng đăng ký bị cắt đứt lần này, cô cho rằng: xét về lâu dài, nỗi đau này sẽ có lợi, nó sẽ thúc đẩy tiến bộ kỹ thuật.

OpenClaw, OpenCode và các khung bên thứ ba kiểu đó vẫn có thể gọi Claude thông qua API, chỉ là không còn được ngồi “xe miễn phí” bằng đăng ký nữa. Trong ngắn hạn, các người dùng Agent sẽ rất đau — chi phí dễ dàng nhảy vọt lên vài chục lần. Nhưng chính áp lực này sẽ thúc đẩy các khung đó nghiêm túc cải tiến quản lý context, tối đa hóa tỷ lệ cache hit của prompt để tái sử dụng context đã xử lý, và cắt giảm tiêu hao token vô ích. Nỗi đau cuối cùng sẽ chuyển hóa thành kỷ luật kỹ thuật.

Đồng thời, cô cũng đưa ra cảnh báo, khuyên các công ty mô hình lớn đừng lao vào cuộc chiến giá cả một cách mù quáng; bán token giá rẻ mà lại để mặc cho công cụ bên thứ ba “hút máu” là một cái bẫy.

Tôi muốn khuyên các nhà sản xuất mô hình lớn: nếu chưa nghĩ rõ ràng cách định giá subscription cho phần coding mà không dẫn tới “đốt máu” lớn, thì đừng lao vào việc kéo giá xuống đáy. Bán token với giá cực rẻ, đồng thời mở toang cánh cửa cho các khung bên thứ ba — bề ngoài có vẻ thân thiện với người dùng, nhưng thực chất là một cái bẫy — Anthropic vừa bò ra khỏi cái bẫy đó. Vấn đề sâu hơn là: nếu người dùng dành thời gian và công sức vào các khung Agent chất lượng kém, vào dịch vụ suy luận cực kỳ không ổn định và chậm, vào những mô hình bị cắt giảm để giảm chi phí; cuối cùng lại phát hiện vẫn chẳng làm được gì — thì đó sẽ là vòng lặp xấu cho trải nghiệm người dùng và tỷ lệ giữ chân.

Tiếp theo, cô còn giới thiệu MiMo Token Plan mà Xiaomi gần đây mới ra mắt, và nhấn mạnh rằng họ “theo đuổi việc giao trả ổn định lâu dài các mô hình và dịch vụ chất lượng cao”.

Về MiMo Token Plan — nó hỗ trợ tích hợp các khung bên thứ ba, tính phí theo hạn mức token, logic giống với gói extra usage mà Claude vừa ra mắt. Vì chúng tôi theo đuổi việc giao trả ổn định lâu dài các mô hình và dịch vụ chất lượng cao — không phải để bạn trả tiền bốc đồng rồi rời bỏ giữa chừng.

Cuối cùng, cô chỉ ra rằng, hiện nay nguồn cung điện toán toàn cầu đã không theo kịp nhu cầu token mà các Agent tạo ra. Lối thoát thật sự không phải là token rẻ hơn, mà là tiến hóa phối hợp — “khung Agent tiết kiệm token hơn” × “mô hình mạnh mẽ hơn, hiệu quả hơn”. Hành động lần này của Anthropic, dù họ có chủ ý hay không, cũng đang đẩy toàn bộ hệ sinh thái — cả mã nguồn mở lẫn mã nguồn đóng — đi theo hướng đó. Có lẽ đây là một điều tốt.

Trước quan điểm của Luo Fuli, cộng đồng nhà phát triển phản ứng mạnh mẽ, và trọng tâm thảo luận nhanh chóng chuyển từ “Anthropic đúng hay sai” sang một số vấn đề căn bản hơn:

  1. Đây không phải là một cuộc tranh cãi về định giá, mà là một sự viết lại mang tính cấu trúc của kinh tế học AI.

Như Luo Fuli nói, chi phí đơn vị của dịch vụ AI từ trước đến nay không do riêng mô hình quyết định, mà do “mô hình × khung × quản lý context” cộng hưởng quyết định. Hành động lần này của Anthropic vô tình tạo ra một áp lực chọn lọc tự nhiên đối với các framework Agent.

Có người còn nói thẳng: tín hiệu mà Anthropic lần này thực sự truyền đi là — lớp orchestration mới là sản phẩm, chứ không chỉ bản thân mô hình. Sự căng thẳng giữa đăng ký và tính phí theo API chỉ là triệu chứng bề mặt của logic sâu hơn này.

  1. Đừng vội mắng chuyện định giá; hãy xem điện toán đã bị đốt cháy như thế nào trước.

“Lãng phí điện toán” mà Luo Fuli nói đã nhận được sự đồng cảm mạnh mẽ từ những người trong ngành. Có người chỉ thẳng một cách sắc bén: đây không phải là vấn đề “AI quá đắt”, mà là vấn đề “điện toán bị làm bừa”. Thiết kế khung thô sơ cộng với cửa sổ context khổng lồ cộng với các lệnh gọi dư thừa không cần thiết — số tiền bị đốt đi đổi lấy chẳng được bất kỳ sản xuất đầu ra thực sự nào.

Những hiểu sâu hơn đến từ một nhà phát triển, người cho biết: các quyết định xử lý context trong Claude Code từ trước đến nay chưa bao giờ là một tham số mặc định; mà là phán đoán đã được “nung nấu” vào kiến trúc sau nhiều lần cân nhắc về “giữ lại gì, bỏ đi gì, khi nào thì nén”. Các khung bên thứ ba không thiếu chức năng, mà thiếu loại ý kiến kỹ thuật được tích hợp sẵn đó.

Một nhà phát triển khác thì dùng chính kinh nghiệm của mình để chứng thực điều này: anh ấy tháng trước đã tốn rất nhiều thời gian để dọn dẹp các logic dư thừa trong lớp orchestration cũ mà anh xây dựng cho khách hàng, “dọn dẹp đống rác còn tốn công hơn nhiều so với lúc xây dựng ban đầu”.

  1. Việc đào thải trên thị trường đã bắt đầu, nhưng kết cục vẫn chưa chắc chắn.

Luo Fuli cho rằng áp lực chi phí sẽ thúc đẩy sự tiến hóa của các khung, nhưng các nhà phát triển nêu ra một câu hỏi thậm chí tàn nhẫn hơn: liệu các khung bên thứ ba có thể nhanh chóng bù được khoảng cách hiệu quả để khiến giá API về mặt kinh tế vẫn còn chấp nhận được không? Hay đa số người dùng thấy chi phí quá thảm, rồi mặc định quay trở lại Claude Code?

Hai lối đi này dẫn đến những cấu trúc hệ sinh thái hoàn toàn khác nhau. Một nhà phát triển bổ sung rằng: thứ các nhà phát triển khung thực sự cần không phải là “quyền tích hợp được bao gồm trong đó”, mà là hạn mức token rõ ràng, có thể dự đoán được — ranh giới minh bạch sẽ thúc đẩy hành vi sản phẩm tốt hơn, còn vùng xám mờ mịt chỉ tạo ra hỗn loạn.

Bài đăng của Luo Fuli là một tín hiệu tiến hóa kỹ thuật rất mang tính tiên phong, và các thảo luận liên quan cũng chạm đúng vào các điểm đau cốt lõi của kỹ thuật phần mềm AI hiện tại. Tiếp theo, chỉ còn chờ xem toàn bộ thị trường sẽ chuyển từ “đốt điện toán một cách thô bạo” sang “kiến trúc kỹ thuật tinh xảo” như thế nào.

Nguồn tin phong phú, diễn giải chính xác, tất cả có tại ứng dụng Tài chính Sina

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Gate Fun hot

    Xem thêm
  • Vốn hóa:$2.24KNgười nắm giữ:0
    0.00%
  • Vốn hóa:$2.23KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.24KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$0.1Người nắm giữ:0
    0.00%
  • Vốn hóa:$2.27KNgười nắm giữ:2
    0.07%
  • Ghim