Token trở thành “quái vật nuốt tiền” sức mạnh tính toán của các tập đoàn lớn tăng vọt

robot
Đang tạo bản tóm tắt

Bạn có nhận ra không, phong cách vẽ trong giới AI nửa năm nay trông nhanh hơn một chút?

Đúng lúc này năm ngoái, mọi người còn đang cuồng nhiệt mừng vì giá giảm sức mạnh tính toán. Alibaba Cloud dẫn đầu bằng câu “mức giảm cao nhất 60%”, rồi Tencent Cloud, Huawei Cloud, Baidu Cloud cũng đồng loạt theo sau. Cái không khí đó, giống hệt kiểu đại khuyến mãi Double 11. Trong các nhóm khởi nghiệp, ngày nào cũng có người khoe hóa đơn: “Xem này, 1 triệu Token của tôi chỉ tốn vài chục xu!” Hồi đó ai cũng nghĩ mùa xuân của khởi nghiệp AI đã đến: sức mạnh tính toán rẻ như rau, ai mà chẳng làm được ứng dụng mô hình lớn chứ?

Thế nhưng sao rồi? Cú tát mặt đến quá nhanh.

Chỉ ngay tháng trước, “hướng gió” đã xoay ngoặt 180 độ. Trong vòng 10 ngày, Google, Amazon, Tencent, Alibaba, Baidu đều ra thông báo tăng giá. Tăng bao nhiêu? Thông thường là 30% đến 50%. “Gắt” nhất là Tencent Cloud: có một sản phẩm cốt lõi tăng thẳng 400%.

Từ “bán tháo nhảy lầu đại hạ giá” sang “tăng giá kiểu phóng tên lửa”, chưa đầy một năm. Thế rốt cuộc đã xảy ra gì? Ai là người đẩy giá đi lên ở phía sau? Quan trọng hơn, trong đợt tăng giá này, ai là người thảm nhất và ai đang cười trộm?

Năm ngoái còn “giảm như đánh vào xương”, năm nay vì sao tập thể lại tăng giá?

Trước hết hãy điểm lại nhanh vở “kịch đảo chiều” này.

Tháng 4/2025, Alibaba Cloud là bên đầu tiên ném ra một quả bom hạng nặng: sản phẩm cốt lõi giảm giá cao nhất 60%. Cái này không phải chỉ là giảm nhẹ, mà là kiểu “cắt đôi rồi lại giảm giá”. Ngay sau đó, JD Cloud nói “giảm đại đi, tôi theo”, Tencent Cloud, Huawei Cloud, Baidu Cloud cũng đều làm theo. Trong chốc lát, khói lửa của thị trường sức mạnh tính toán mù mịt, cuộc chiến giá cả đánh đến mức náo nhiệt không tưởng.

Khi đó khẩu hiệu là gì? “Cho AI dùng được”, “phổ cập sức mạnh tính toán”. Nhiều công ty khởi nghiệp thật sự tin, bắt đầu rầm rộ đốt Token, chạy mô hình.

Nhưng bữa trưa miễn phí thì chưa bao giờ kéo dài lâu.

Tháng 1/2026, Amazon AWS lặng lẽ làm một việc—không có bất kỳ buổi họp công bố nào, cũng không hề có thông báo trước, trực tiếp tăng giá máy chủ EC2 lên khoảng 15%. Nhìn thì không lớn, nhưng ý nghĩa lại rất lớn: đây là lần đầu tiên ngành dịch vụ đám mây trong gần hai mươi năm tăng giá. Biết rằng, trong suốt hai mươi năm qua, số lần AWS giảm giá nhiều hơn 100 lần—chưa từng có chuyện chỉ đi xuống, không lẽ lại tăng.

Việc này, giống như đổ domino.

Ngày 11/3, Tencent Cloud theo ngay sau đó: giá đầu vào của mô hình Tencent HY2.0 Instruct từ 0.0008 nhân dân tệ/1 nghìn tokens tăng lên 0.004505 nhân dân tệ/1 nghìn tokens—mức tăng 463%, hơn gấp bốn lần. Ngày 18/3, Alibaba Cloud công bố sản phẩm thẻ sức mạnh tính toán tăng từ 5% đến 34%, còn Baidu Intelligent Cloud cũng tăng theo từ 5% đến 30%. Những mô hình ra mắt công khai miễn phí trước đó, như GLM 5, MiniMax 2.5, Kimi 2.5, tất cả đều kết thúc “thời kỳ ăn ké” và chuyển sang thu phí chính thức.

Từ “giành nhau giảm giá” sang “giành nhau tăng giá”, vì sao đổi nhanh đến vậy?

Bề ngoài là do các hãng đám mây không chịu nổi. GPU càng mua càng đắt, chi phí điện cho trung tâm dữ liệu chiếm 40% đến 60% chi phí vận hành, cộng thêm đến nửa cuối năm 2025, giá chip lưu trữ cũng bắt đầu tăng—áp lực ở đầu chi phí đang đè lên thực sự. Nhưng lý do căn bản khiến việc tăng giá biến thành “không thể không làm” lại là một nguyên nhân khác—sức mạnh tính toán, thật sự đã không đủ.

Ai đang điên cuồng “ăn” Token? Sự thật 140 nghìn tỷ

Trước đó chẳng phải nói là sức mạnh tính toán dư thừa sao? Sao đột nhiên lại không đủ?

Đáp án là: Token bị “ăn” quá nhanh.

Theo dữ liệu được Cục trưởng Cục Dữ liệu Nhà nước Lưu Liệt Hồng tiết lộ vào tháng 3 năm nay: đến tháng 3/2026, lượng gọi Token mỗi ngày của Trung Quốc đã vượt 140 nghìn tỷ.

Con số này phi lý cỡ nào? Cho bạn hai mốc so sánh:

· Đầu năm 2024, con số này chỉ là 1.4M. Trong hai năm, tăng hơn một nghìn lần.

· Cuối năm 2025, con số này là 100 nghìn tỷ. Tức là chỉ trong ba tháng vừa qua, lại tăng thêm 40%—riêng lượng mới tăng trong ba tháng đó (40 nghìn tỷ) đã tương đương 400 lần so với cả ngày của đầu năm 2024.

Đây không phải tăng tuyến tính, mà là cơn hải triều.

Vậy vấn đề là: ai đang điên cuồng tiêu thụ Token?

Chỉ có một từ để trả lời: tác nhân (Agent).

Từ năm ngoái, các sản phẩm tác nhân mã nguồn mở như OpenClaw (tên giang hồ là “tôm hùm”) đã trở nên cực kỳ hot. AI từ một robot chỉ biết “chat” đã biến thành trợ lý có thể “làm việc”—giúp bạn đặt vé máy bay, viết code, làm PPT, phân tích dữ liệu… Nghe ngầu đúng không? Nhưng cái giá là: tác nhân khi làm một việc đơn giản sẽ tiêu thụ lượng Token gấp 10 đến 100 lần so với hội thoại thông thường.

Ví dụ: nếu để AI giúp bạn viết một đoạn mã script web crawler. Nếu là hội thoại bình thường, nó sẽ đưa bạn một đoạn code, bạn copy xong là xong, tiêu thụ chỉ vài trăm Token. Nhưng nếu là tác nhân, nó phải tự chạy code, báo lỗi, gỡ lỗi, chạy lại, rồi lại chạy… qua lại chừng mười mấy vòng, mức tiêu thụ Token có thể vọt thẳng lên vài chục nghìn.

Chưa kể đến việc tạo video kiểu “kẻ ăn nuốt vàng” này. Có phân tích cho rằng, để tạo 1 phút video cần khoảng 100k tỷ Token. Còn hiện nay, các mô hình video tạo ra 5 giây video chỉ thu bạn vài chục xu đến vài đồng—đây nào phải kiếm tiền, rõ ràng là lỗ vốn để lấy tiếng. Nhưng không chịu nổi vì số người dùng quá nhiều: video, âm nhạc, code, phân tích dữ liệu… mọi hướng đều đang điên cuồng “ăn” Token.

Cung không theo kịp cầu, sức mạnh tính toán đương nhiên phải tăng giá. Đây không phải âm mưu, mà là sự mất cân bằng cung-cầu trần trụi.

Giải đua xếp hạng sức mạnh tính toán: đại công ty ăn thịt, kẻ chơi nhỏ không uống nổi cả canh

Chuyện tăng giá này, với mỗi người lại mang ý nghĩa hoàn toàn khác nhau.

Với các hãng đám mây, tăng giá lại là điều tốt. Có một công ty chứng khoán tính một khoản: cứ Alibaba Cloud tăng giá 1%, tỷ suất lợi nhuận của nó tăng thêm 1 điểm phần trăm. Vì vậy bạn thấy số liệu là: phần của Alibaba Cloud không giảm mà lại tăng, hiện đã chiếm 36% thị trường đám mây AI của Trung Quốc. Và ở mảng “gọi AI” chi tiết hơn—đến cả Volcano Engine (thuộc ByteDance)—còn chiếm gần 50%: nghĩa là, một nửa lượng gọi Token của cả nước đi qua đường ống của Volcano Engine.

Trong khi đó, phần của Huawei Cloud và Tencent Cloud lại giảm nhẹ. Hiệu ứng đầu bảng ngày càng rõ rệt: công ty lớn càng làm càng mạnh, tài nguyên càng tập trung.

Vậy ai thảm nhất?

Các công ty khởi nghiệp AI quy mô trung bình và nhỏ, cùng những người chơi mới vừa bước vào.

Lý do rất đơn giản: tăng giá trực tiếp đẩy chi phí vận hành của họ lên. Trước kia khi Token còn rẻ, bạn có thể thoải mái chạy thử nghiệm, muốn tinh chỉnh mô hình thế nào thì tinh chỉnh, dù sao cũng không tốn mấy tiền. Giờ giá tăng gấp vài lần đến cả mười mấy lần: mỗi lần huấn luyện và mỗi lượt suy luận đều phải cân đo.

Rắc rối hơn nữa là người chơi nhỏ không có năng lực thương lượng giá. Khách hàng lớn có thể ký hợp đồng dài hạn với hãng đám mây để chốt mức giá tương đối ưu đãi. Bạn là một công ty khởi nghiệp, mỗi năm chỉ tiêu vài chục nghìn tệ cho phí sức mạnh tính toán—ai chịu đàm phán giảm giá với bạn? Bạn chỉ có thể ngoan ngoãn trả tiền theo giá tăng.

Nhiều dự án từng định làm ứng dụng AI, sau khi tính một lượt chi phí, liền âm thầm gác lại. Một số dự án đã làm thì hoặc thu hẹp quy mô, hoặc tự gồng chịu lỗ. Mà trớ trêu là thị trường đầu cuối lại cạnh tranh khốc liệt: bạn không dám dễ dàng tăng giá với người dùng—bên kia vẫn miễn phí, bạn mà thu phí thì người dùng chạy hết. Cuối cùng, toàn bộ áp lực chi phí chỉ có thể tự nuốt.

Một người trong nghề than với tôi: “Trước kia tôi nghĩ sức mạnh tính toán rẻ, cổng vào khởi nghiệp thấp. Giờ mới biết cổng vào không phải thấp đi, mà là họ cho bạn vào trước, rồi đóng cửa lại.”

Thực ra đây là một cuộc đua xếp hạng tàn khốc. Trong hai mươi năm qua, các hãng đám mây dựa vào chiến thuật “giảm giá để bán nhiều, rồi chiếm đất trước khi có lợi nhuận” nên sống rất sung sướng. Nhưng thời đó đã kết thúc. Sức mạnh tính toán đã chính thức từ giã thời kỳ trợ giá, bước vào giai đoạn định giá thương mại. Tương lai không còn so ai rẻ hơn, mà là ai có dịch vụ ổn định hơn, ai có hệ sinh thái hoàn thiện hơn, và ai giúp doanh nghiệp dùng thực sự tốt từng phần sức mạnh tính toán.

Và trong cuộc đua xếp hạng này, kẻ chơi nhỏ rất có khả năng bị tụt lại phía sau.

Quay lại nhìn cú tàu lượn một năm rưỡi qua, bạn sẽ thấy một sự thật khá chát:

Từ “giá sức mạnh tính toán như rau” sang “giá như tên lửa”, về bản chất là hình ảnh thu nhỏ của ngành AI từ tăng trưởng hoang dã sang giai đoạn chín muồi. Kết thúc thời đại miễn phí, bắt đầu cuộc cạnh tranh bằng giá trị. Những mô hình kinh doanh dựa vào trợ cấp sẽ chết đi, còn những sản phẩm thật sự có công nghệ, có kịch bản sử dụng và có người dùng sẽ sống sót trong môi trường chi phí sức mạnh tính toán tăng lên—thậm chí sống còn tốt hơn.

Năng lực cạnh tranh cốt lõi của khởi nghiệp AI, từ trước đến nay không phải là sức mạnh tính toán rẻ đến mức nào, mà là bạn dùng sức mạnh tính toán để làm gì.

Thời đại sức mạnh tính toán, Token đúng là đắt hơn. Nhưng thứ đắt hơn Token lại là bộ não biết cách dùng tốt Token.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Gate Fun hot

    Xem thêm
  • Vốn hóa:$2.23KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.26KNgười nắm giữ:2
    0.07%
  • Vốn hóa:$2.22KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.23KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.23KNgười nắm giữ:0
    0.00%
  • Ghim