Cuộc chiến "Trợ cấp Token" của các ông lớn AI sắp kết thúc chưa?

Token đắt đỏ, đốt cháy lòng người.

Điều này không chỉ là tiếng lòng của những người hiện đang say mê Vibe Coding, ngay cả các tập đoàn lớn ở Silicon Valley từng tuyên truyền cuồng nhiệt về Tokenmaxxing cũng bắt đầu mở giới hạn Token cho nhân viên của mình.

Nhưng thực ra một điểm phản trực giác là, khi các bạn đang sử dụng AI theo dạng đăng ký, thì Token các bạn dùng thực chất đã được các ông lớn AI bù đắp rồi, mức bù đắp cao nhất thậm chí có thể lên tới 70 lần phí đăng ký!

Điều còn đáng lo hơn nữa là, hai ông lớn dẫn đầu trong ngành AI là OpenAI và Anthropic đã bước vào giai đoạn chạy đua IPO. Khi hai công ty này niêm yết,

Liệu sau khi họ lên sàn, có giống như thời kỳ "chiến tranh trợ giá" của internet ngày xưa, các công ty còn lại bắt đầu nâng giá khách hàng, đưa giá Token trở về mức hợp lý?

Tin vui là, khả năng điều đó sẽ không xảy ra. Gần đây, nhà sáng lập Google Ventures Bill Maris đã đặt ra một câu hỏi trong podcast All-in:

Nếu Google quyết định giảm giá token thêm 80%, thì OpenAI và Anthropic sẽ phản ứng thế nào?

Không chỉ vậy, không lâu trước đó, nhóm khởi nghiệp Agnes AI đã giải thích chi tiết trong buổi livestream với GEEK PARK về khả năng đến gần của "Thời đại miễn phí Token".

Vậy, tương lai giá Token sẽ tăng hay giảm? Và điều này có ý nghĩa gì đối với những người đã nghiện AI rồi?

Trợ giá Token đã bốc hơi

Tại sao nói rằng, hiện tại giá Token thực ra không đắt?

Bởi ít nhất trong mô hình đăng ký AI, các công ty AI hiện nay đã bán với mức giá đã được trợ giá "đứt đoạn".

Gần đây, SemiAnalysis đã đánh giá chi tiết về so sánh giá trị Token tiêu thụ thực tế và phí đăng ký trong mô hình của OpenAI và Anthropic.

SemiAnalysis đã làm một việc đơn giản nhưng hiệu quả — sử dụng AI thực tế để hoàn thành các nhiệm vụ khác nhau trên các nền tảng đăng ký, rồi dựa vào giá API công khai để tính toán giá trị token của các nhiệm vụ đó. Kết quả như sau:

Chú ý một quy luật: Gói dịch vụ càng đắt, mức trợ giá càng cao. Điều này tự nó đã cho thấy các gói cao cấp không phải để kiếm lời — chúng là một dạng "định giá ngược", dùng cách thua lỗ cực đoan để giữ chân người dùng nặng. Bởi người dùng nặng là các nhà phát triển, là các quyết định doanh nghiệp, khi họ đã bị gắn bó với một nền tảng nào đó, sẽ kéo theo cả đội nhóm và toàn bộ dòng sản phẩm phía sau.

Đốt cháy đến mức này, tại sao vẫn còn làm? Câu trả lời tiêu chuẩn là: ban đầu đốt tiền để mở rộng quy mô, quy mô lớn rồi sẽ tăng giá để thu hồi vốn. Internet di động cũng chơi theo cách này — Didi và Uber trợ giá hàng trăm tỷ nhân dân tệ cho cước xe, sau trợ giá xong, giá xe tăng; Meituan trợ giá vô số bữa ăn, sau trợ giá, phí giao hàng cũng tăng. Logic này có một điều kiện tiên quyết: trong thời gian trợ giá, đã tạo ra hiệu ứng khóa chặt.

Didi có thể tăng giá vì tài xế không thể rời khỏi dòng đơn hàng của nền tảng, khách hàng cũng không thể bỏ qua tài xế của nền tảng đó. Meituan có thể tăng giá vì thương nhân không thể bỏ qua lượng truy cập và hệ thống giao hàng của nó. Khi trợ giá kết thúc, người dùng đã bị "khóa" trong hệ sinh thái, chi phí chuyển đổi cực kỳ cao.

Nhưng cuộc chiến AI, khác với internet, có một điểm khác biệt căn bản — Token hầu như không có hiệu ứng khóa chặt.

Nếu Claude tăng giá, các nhà phát triển có thể trong một ngày chuyển API sang GPT hoặc Gemini — các giao diện của các nhà cung cấp ngày càng chuẩn hóa, nhiều framework còn tích hợp chức năng chuyển đổi đa mô hình. Đối với người dùng phổ thông thì đơn giản hơn: chỉ cần đổi URL là xong. AI không giống như dịch vụ gọi xe có mạng lưới tài xế địa phương, không giống như dịch vụ giao đồ ăn có hệ thống phân phối, không giống như mạng xã hội có mối quan hệ bạn bè. Token là token, của nhà sản xuất nào cũng vậy, đều là cùng một thứ.

Điều này có nghĩa là, khi trợ giá chấm dứt, người dùng có thể mất hút ngay lập tức. Trợ giá không phải để "xây dựng hàng rào", mà giống như "duy trì nhịp đập" — chỉ cần có ai đó trả giá thấp hơn, người dùng sẽ bỏ đi.

Chưa kể đến một biến số mới đang khiến tất cả các bảng cân đối tài chính bị mất kiểm soát: AI Agent.

Khi bạn trò chuyện với ChatGPT, một lần đối thoại có thể tiêu tốn vài nghìn token. Nhưng khi bạn để AI Agent thực hiện một nhiệm vụ phức tạp — viết đoạn mã rồi tự động debug, phân tích một tài liệu dài vài chục trang rồi tạo báo cáo — một vòng như vậy, lượng token tiêu hao sẽ gấp 5 đến 30 lần so với đối thoại bình thường. Có nhà phát triển thử nghiệm thực tế, trên gói Claude Max 100 USD, một lần hội thoại lập trình của Agent có thể tiêu tốn gần trăm USD token. CTO của Uber gần đây tiết lộ, công ty đã tiêu hết ngân sách AI năm 2026 trong vòng chưa đầy bốn tháng.

Vấn đề là, cuộc chiến trợ giá Token này có thể kéo dài bao lâu? Ai có khả năng đứng vững sau cuộc chiến hỗn loạn này?

Bill Maris cho rằng câu trả lời rõ ràng là các ông lớn truyền thống.

Token như một vũ khí

Để hiểu rõ sự tàn khốc của cuộc chiến trợ giá này, cần nhìn rõ một sự bất cân xứng về cấu trúc — các bên tham chiến có nguồn vũ khí hoàn toàn khác nhau.

Google mỗi năm thu hơn 300 tỷ USD từ quảng cáo. Đó không phải là tiền của nhà đầu tư hay tiền vay mượn, mà là một chiếc máy in tiền tự vận hành mỗi ngày. Hàng tỷ người trên thế giới mỗi ngày mở trình duyệt tìm kiếm, xem YouTube, dùng Gmail, tiền quảng cáo tự nhiên chảy vào tài khoản. Nó không cần phải trình bày, không cần phải nịnh nọt nhà phân tích, không cần giải thích lý do tiêu tiền.

Google dùng lợi nhuận từ quảng cáo để trợ giá token AI, giống như một người sở hữu mỏ dầu đi đấu giá giá xăng — dầu của họ là từ đất của chính họ, còn đối thủ là vay ngân hàng mua dầu.

OpenAI và Anthropic chính là những người vay ngân hàng để mua dầu.

OpenAI đã huy động hơn 180 tỷ USD, định giá mới vượt 850 tỷ USD. Anthropic huy động hơn 130 tỷ USD. Những khoản tiền này đến từ các quỹ đầu tư mạo hiểm và nhà đầu tư chiến lược — họ không bỏ tiền ra làm từ thiện, mà kỳ vọng các công ty này sẽ lên sàn, kỳ vọng thoái vốn để thu về lợi nhuận lớn.

Và sau khi lên sàn, rắc rối mới bắt đầu. Lên sàn đồng nghĩa với việc báo cáo tài chính công khai toàn thế giới. Mỗi quý, các nhà phân tích trên Wall Street sẽ theo dõi doanh thu, lợi nhuận, chi phí thu hút người dùng, chi phí biên. Khi họ tính ra rằng, mỗi đô la đăng ký bạn nhận được thực chất lỗ 70 đô la — kể cả câu chuyện tăng trưởng rực rỡ cũng không giữ nổi giá cổ phiếu.

Bill Maris nói rõ trong podcast: "Nếu tôi là Google, quyết định giảm giá token 80% thì mô hình kinh doanh của OpenAI và Anthropic sẽ ra sao?"

Người dẫn hỏi xác suất có thể xảy ra là bao nhiêu. Maris không do dự: "100%. Capital as a weapon, tokens as a weapon(Vốn như vũ khí, token như vũ khí)."

Đây không phải là dự đoán của nhà phân tích. Bill Maris là sáng lập và CEO của Google Ventures, đồng thời là phó chủ tịch các dự án đặc biệt của Google, đã từng ươm mầm cho Waymo và Google X. Tất cả mọi người đều hiểu: đây không phải giả thuyết, đây là những gì ông đã chứng kiến Google chiến đấu.

Ông mô tả kịch bản rất đơn giản: Google tuyên bố Gemini API giảm giá 80%. Các khách hàng doanh nghiệp sẽ làm gì? Nếu chất lượng sản phẩm gần như tương đương — trong nhiều bài kiểm tra tiêu chuẩn, Gemini đã sánh ngang Claude, GPT — nhưng giá rẻ hơn 4 phần 5, bạn có còn dùng cái đắt hơn không?

Maris tự trả lời: "Nếu bạn là một công ty, chỉ cần bỏ ít hơn 80% tiền để mua Google hoặc Gemini, với sản phẩm cơ bản như nhau, tại sao không?" Và áp lực lên các công ty đó sẽ rất lớn.

Trong khi đó, OpenAI và Anthropic gần như không có cách phản đòn tương xứng. Họ không thể giảm giá tiếp — không có máy in tiền, mỗi đô la là của nhà đầu tư. Họ cũng không thể duy trì chênh lệch về công nghệ — khoảng cách giữa các mô hình lớn đang nhanh chóng thu hẹp, hôm nay bạn dẫn đầu ba tháng, ba tháng sau đã bị bắt kịp. Không giống như iPhone và Nokia, đó là chênh lệch công nghệ của một thế hệ. Các mô hình AI, hàng rào phòng thủ của chúng, giống như đê cát, sóng lớn tràn qua là xong.

Trong câu chuyện của Bill, Google có vẻ thắng lớn, nhưng trong thế giới AI, liệu Google có thể độc quyền thật sự? Meta có thể mở mã nguồn một mô hình miễn phí bất cứ lúc nào, Trung Quốc có DeepSeek và ByteDance, Amazon đang phát triển mô hình riêng. Khi giá token bị đẩy xuống mức rẻ bèo, đối thủ không biến mất — họ cũng đang giảm giá.

Cuộc chiến AI, có thể không có người thắng cuộc.

"Trò chơi vô hạn" của Token?

Ngay cả những người ít hiểu biết về lịch sử cũng phần nào dự đoán được kết cục của cuộc chiến AI hiện tại:

Một là "kịch bản dịch vụ internet" — câu chuyện của Didi, Amazon: trợ giá trước, độc quyền sau, rồi tăng giá thu lợi. Trong kịch bản này, cuộc chiến giá hiện tại chỉ là phần mở đầu, cuối cùng sẽ có một hoặc hai người chiến thắng chiếm phần lớn thị trường, nắm giữ quyền định giá. Nếu đúng vậy, khoản lỗ khổng lồ hiện tại chỉ là một khoản đầu tư hợp lý — giống như Amazon thua lỗ hai mươi năm, cuối cùng trở thành ông vua thương mại điện tử và đám mây.

Hai là "kịch bản điện nước". Token trở thành một nguồn tài nguyên tiêu chuẩn hóa — giống như điện, băng thông, lưu trữ đám mây. Không ai có thể duy trì quyền định giá lâu dài vì sản phẩm quá nhỏ khác biệt, chi phí chuyển đổi quá thấp. Cạnh tranh đẩy giá về sát chi phí, lợi nhuận gần như bằng 0. Cuối cùng, chính phủ có thể can thiệp điều tiết — như cách họ đã làm với điện và viễn thông hơn một thế kỷ trước.

Sự phân biệt giữa hai kịch bản này phụ thuộc vào một từ:

Khóa chặt.

Didi có thể tăng giá vì tài xế không thể rời khỏi dòng đơn hàng của nền tảng, khách hàng cũng không thể bỏ qua tài xế của nền tảng đó. Amazon có thể tăng giá vì thương nhân không thể bỏ qua lượng truy cập và hệ thống logistics của họ.

Hiệu ứng khóa chặt là nền tảng của mô hình "đốt tiền rồi mới kiếm lời".

Nhưng AI token — như đã phân tích — hầu như không có hiệu ứng khóa chặt. API chuẩn hóa, chi phí chuyển đổi gần như bằng 0. Điều kiện tiên quyết của kịch bản thứ nhất, trên sản phẩm token này, hoàn toàn không tồn tại.

Nếu kịch bản thứ hai, "hạ tầng cơ bản" như điện, nước, khí đốt, thì kết quả cuối cùng gần như đã rõ ràng: chúng ta đang chứng kiến không phải một cuộc chiến cuối cùng phân thắng bại, mà là một cuộc thi tiêu hao không có hồi kết.

Ông vua sáng lập Meituan, Wang Xing, từng mô tả trạng thái cạnh tranh này. Ông nhận định: Một số cuộc cạnh tranh không có khái niệm "thắng". Người tham gia không nhằm mục đích thắng đối thủ, mà là đảm bảo luôn còn trên bàn chơi. Bởi chỉ cần còn trên bàn, họ vẫn có thể tiếp tục huy động vốn, tuyển dụng, đổi mới. Rời khỏi bàn mới là thất bại duy nhất.

Dựa trên khung cảnh này, nhìn lại bức tranh AI ngày nay, nhiều điều tưởng mâu thuẫn bỗng trở nên rõ ràng.

Giá trị mới nhất của OpenAI vượt 800 tỷ USD không phải vì huấn luyện mô hình tốn quá nhiều tiền. Mà là để tiếp tục chơi cuộc chiến giá. Vốn huy động không phải để thắng, mà để "có tư cách tiếp tục chơi".

Google chuẩn bị giảm giá token 80%, không phải để tiêu diệt OpenAI và Anthropic. Mà để đảm bảo vị trí trung tâm của mình trong kỷ nguyên AI — giống như họ đã dùng Android miễn phí để đảm bảo không bị bỏ lại phía sau trong thời đại di động.

Trong khi đó, Anthropic nâng giá API của mô hình flagship Fable 5 lên gấp đôi thế hệ trước — nhập mỗi triệu token 10 USD, xuất mỗi triệu 50 USD — tưởng như "tăng giá", thực ra là chủ động chọn lọc khách hàng doanh nghiệp sẵn sàng trả cao cho khả năng cao cấp, vì họ rõ ràng: cuộc chiến trợ giá của người tiêu dùng là không thể thắng Google.

Mỗi vòng giá đều mở rộng quy mô sử dụng AI. Quy mô lớn hơn đồng nghĩa với nhiều dữ liệu hơn, nhiều kịch bản hơn, nhiều nhà phát triển hơn đổ vào hệ sinh thái. Điều này lại khiến các mô hình của tất cả các bên mạnh hơn. Các bên tham chiến dùng chiến tranh để thu hút tài nguyên nâng cấp chính mình — không phải là cuộc chơi thắng-thua kiểu zero-sum, mà là một quá trình tất cả cùng mạnh lên qua cạnh tranh, nhưng cũng khó mà kiếm lợi nhuận đột biến.

Nghe có vẻ như mô hình ngành điện cuối cùng?

Hơn 140 năm trước, Edison và Westinghouse đều nghĩ rằng họ đang tranh giành thị trường độc quyền. Họ bỏ hết tất cả, cược rằng: "Ai định nghĩa tiêu chuẩn của điện, người đó sẽ sở hữu điện." Nhưng số phận của điện đã cho chúng ta một bài học đơn giản:

Khi một công nghệ đủ quan trọng, đủ phổ biến, đủ tiêu chuẩn, nó không còn thuộc về bất kỳ công ty nào nữa. Nó thuộc về hạ tầng cơ bản.

Cuộc đua AI, bề ngoài là Google đối đầu OpenAI, đối đầu Anthropic, là cuộc thi năng lực mô hình, là cuộc đua quy mô huy động vốn. Nhưng khi kéo xa tầm nhìn ra, thì mục đích thực sự của cuộc đua này là: nó đang thúc đẩy AI tiến tới một tầng hạ tầng cơ bản mà bất kỳ công ty nào cũng không thể độc quyền.

Khi Bill Maris nói "100% sẽ xảy ra", ông có thể không chỉ dự đoán Google sẽ giảm giá. Ông có thể đang vô thức dự báo một xu hướng lớn hơn — trong thế giới AI, token cuối cùng sẽ không thuộc về ai cả. Giống như ngày nay, không ai "sở hữu" điện.

Đối với OpenAI và Anthropic, điều này mang lại một điều đáng lo ngại: Dù có dẫn đầu về công nghệ, dù có huy động vô số vốn, thì tương lai "kiếm tiền lớn từ AI" mà họ theo đuổi có thể đã không còn tồn tại từ đầu. Họ đang đối mặt không chỉ là một cuộc chiến giá tạm thời, mà là một định mệnh mang tính cấu trúc — những gì họ đang xây dựng, về bản chất, có thể chính là thế hệ tiếp theo của nước, điện, đường cao tốc.

Và đối với người dùng, theo một nghĩa nào đó, có thể là một tin vui. Bởi miễn là cuộc chiến trợ giá Token còn tiếp diễn, mọi người vẫn có thể tận hưởng "món hời" với chi phí 20 USD, sức mạnh tính toán 400 USD.

TOKEN-0,27%
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim