"Tôm hùm" ăn Token điên cuồng, hóa đơn tăng giá "trên mây" đã tới

robot
Đang tạo bản tóm tắt

“Cua ghẹ” (OpenClaw) đã gây ra cơn sốt Token, đang đẩy các nhà cung cấp đám mây vào tình thế khó xử: người dùng sử dụng càng nhiều, họ càng lỗ nặng. Ngày 18 tháng 3, Alibaba Cloud và Baidu Intelligent Cloud quyết định không còn im lặng “chịu đựng”, cùng ngày thông báo sẽ tăng giá các sản phẩm và dịch vụ tính toán AI, lưu trữ từ ngày 18 tháng 4, mức tăng cao nhất lên tới 34%. Thực ra, người chịu thiệt hớm nhất là Tencent Cloud, cách đây một tuần đã điều chỉnh giá của hai mô hình tự phát triển, mức tăng cao nhất vượt quá 450%.

Dù là nâng “giá thuê” cho các card tính toán và tài nguyên lưu trữ, hay trực tiếp “cắt giảm” API (giao diện lập trình ứng dụng) của mô hình, cộng thêm việc các chip lưu trữ dự kiến bước vào chu kỳ tăng giá vào nửa cuối năm 2025, ba nhà cung cấp đám mây đã phải gánh chịu áp lực chi phí không nhỏ, phản ứng dây chuyền liên tục lan rộng. Không phải tất cả các doanh nghiệp điện toán đám mây đều theo xu hướng này, JD Cloud đã công khai tuyên bố: toàn bộ các sản phẩm cốt lõi sẽ không tăng giá. Các nhà cung cấp đám mây khác tạm thời giữ nguyên giá.

Chình làn sóng tăng giá này không phải là ngẫu nhiên, nhiều nhà cung cấp đám mây quốc tế đã điều chỉnh giá các sản phẩm cốt lõi từ tháng 1. AI Agent (tác nhân trí tuệ nhân tạo) khiến các cuộc gọi API tiêu hao nhiều năng lực tính toán hơn, năng lực tính toán là nền tảng, Token là hàng hóa, và hóa đơn đám mây do “cua ghẹ” gây ra đã bắt đầu xuất hiện.

Hai nhà cung cấp đám mây đồng loạt tăng giá

Ngày 18 tháng 3, Alibaba Cloud và Baidu Intelligent Cloud cùng ngày công bố tăng giá. Theo thông báo chính thức, Alibaba Cloud sẽ điều chỉnh giá các dịch vụ liên quan đến card tính toán như Pingtouge Zhenwu 810E và các dịch vụ CPFS (phiên bản trí tuệ tính toán), mức tăng cao nhất lên tới 34%; Baidu Intelligent Cloud cũng rõ ràng rằng giá các sản phẩm dịch vụ liên quan đến năng lực tính toán AI sẽ tăng khoảng 5% đến 30%, và các dịch vụ lưu trữ tệp song song cũng tăng khoảng 30%. Cả hai đều cho rằng, đợt tăng giá này là do “nhu cầu AI toàn cầu bùng nổ”.

Trong đợt tăng giá này, nhanh nhất là Tencent Cloud. Chỉ một tuần trước, Tencent Cloud đã công bố điều chỉnh giá của hai mô hình tự phát triển Tencent HY2.0 Instruct và Tencent HY2.0 Think. Ví dụ, trước khi điều chỉnh, giá nhập cho Tencent HY2.0 Instruct là 0,0008 nhân dân tệ/1.000 Token, sau điều chỉnh tăng lên 0,004505 nhân dân tệ/1.000 Token, tăng 463%. Đồng thời, Tencent Cloud đã kết thúc giai đoạn thử nghiệm miễn phí của ba mô hình GLM 5, MiniMax 2.5, Kimi 2.5, chuyển sang dịch vụ thương mại chính thức.

“Việc tăng giá lần này không ảnh hưởng đến chúng tôi.” Người phụ trách kỹ thuật của một doanh nghiệp vận hành trang web nhỏ nói với phóng viên Báo Bắc Kinh, “Chúng tôi dùng Baidu Intelligent Cloud, nhưng không mua các dịch vụ tính toán AI hay lưu trữ tệp song song.”

Theo giới thiệu trên trang web chính thức, dịch vụ lưu trữ tệp song song PFS của Baidu Intelligent Cloud là hệ thống lưu trữ tệp song song hoàn toàn được quản lý, dễ mở rộng, cung cấp khả năng truy cập dưới mili giây và khả năng đọc/ghi dữ liệu với IOPS cao (một đơn vị đo lường cho thiết bị lưu trữ máy tính). Các ứng dụng bao gồm huấn luyện và suy luận AI, tự lái xe, tính toán hiệu năng cao, render video.

Đối với các khách hàng lâu dài hợp tác, việc tăng giá của Baidu Intelligent Cloud và Alibaba Cloud hiện tại không ảnh hưởng. Theo thông báo, từ 00:00 ngày 18 tháng 4 năm 2026 (giờ Bắc Kinh), hai bên sẽ thực thi mức giá mới. Những khách hàng đã mua dịch vụ sản phẩm trước thời điểm này sẽ không bị ảnh hưởng trong chu kỳ tính phí hiện tại, và giá mới sẽ có hiệu lực trong các kỳ gia hạn tiếp theo.

“Không còn lựa chọn nào khác, chỉ có thể chuyển chi phí sang người dùng”

Cùng ngày Alibaba Cloud và Baidu Intelligent Cloud công bố tăng giá, Tencent công bố báo cáo tài chính quý 4 và cả năm 2025, Chủ tịch kiêm CEO Ma Huateng của Tencent tuyên bố, đến năm 2025, Tencent Cloud sẽ đạt lợi nhuận quy mô.

Trong cuộc họp báo cáo tài chính, các lãnh đạo Tencent khi trả lời về vấn đề tăng giá chip lưu trữ cho biết, nhu cầu AI tăng vọt không chỉ thúc đẩy nhu cầu DRAM và bộ nhớ băng thông cao (HBM) hồi phục, mà còn làm tăng nhu cầu CPU, ổ cứng thể rắn (SSD), ổ cứng cơ (HDD) một cách toàn diện. Hiện tại, các đơn hàng đã phải đặt trước vài tháng, vài quý, thậm chí vài năm. Các nhà cung cấp ưu tiên đảm bảo nguồn cung cho các khách hàng lớn nhất, hợp tác ổn định nhất, như Tencent Cloud. Các nhà cung cấp đám mây nhỏ hơn hiện nay đã khó đảm bảo chuỗi cung ứng ổn định.

Trong bối cảnh đó, các lãnh đạo Tencent cho rằng, ngành hoặc không còn lựa chọn nào khác, chỉ có thể chuyển chi phí tăng giá sang giá bán.

Khi trao đổi với Giám đốc phòng thí nghiệm CHIP Trung Quốc, Lô Quốc Chiêu, ông cũng thẳng thắn nói với phóng viên Báo Bắc Kinh, “việc tăng giá lan rộng là không thể tránh khỏi”.

“Giá của RAM DRAM, SSD NAND/HDD đều đã tăng gấp nhiều lần, vốn dĩ đây chính là chi phí chính của thiết bị dịch vụ đám mây. Mọi người có ảo tưởng rằng bộ tăng tốc AI hoặc GPU (bộ xử lý đồ họa) đắt đỏ, thực ra lượng sử dụng các sản phẩm giá cao này rất hạn chế, tính theo một CPU (bộ xử lý trung tâm) kết hợp 6-8 kênh bộ nhớ, ngay cả cấu hình nhỏ nhất, thì dù không tăng giá cũng đã đắt hơn CPU,” Lô Quốc Chiêu phân tích chi tiết chuỗi cung ứng đám mây cho phóng viên Báo Bắc Kinh.

Nói về năng lực tính toán AI, ông còn giải thích thêm, “Việc triển khai rộng rãi các máy chủ AI và trung tâm tính toán đã làm trầm trọng thêm thiếu hụt chip, đặc biệt là trong hai năm gần đây, các sản phẩm liên quan đến AI được người tiêu dùng phổ thông quan tâm, tâm lý càng làm tăng nhu cầu, dẫn đến tăng giá.”

Từ Token đến năng lực tính toán

Việc tăng giá chuỗi cung ứng chỉ là một mặt của áp lực chi phí của các nhà cung cấp đám mây, nguyên nhân rõ ràng đến từ sự bùng nổ tiêu hao Token do AI Agent gây ra, chính “OpenClaw” (biệt danh của người dùng “cua ghẹ”) là thủ phạm.

Khác với các cuộc trò chuyện AI truyền thống tiêu hao ít Token trong một lần, “cua ghẹ” tự thực thi nhiệm vụ, liên tục gọi các công cụ, mỗi bước thao tác đều tiêu hao lượng lớn Token.

“Giá chắc chắn sẽ ngày càng rẻ hơn,” khi nói về chi phí nuôi “cua ghẹ” trong tương lai, Chủ tịch kiêm CEO của Cheetah Mobile, Fu Sheng, khẳng định với phóng viên Báo Bắc Kinh. Ông giải thích, “Hiện tại giá chủ yếu bị kẹt ở vài điểm then chốt, một là điện, hai là chip, cần thời gian để giải quyết, thực ra còn có thể tối ưu cấu trúc phần mềm. Tại sao năm ngoái (2025) DeepSeek ra mắt lại hot như vậy? Bản chất là nó đã nâng cao hiệu quả kiến trúc. Khi mọi người liên tục tiêu hao Token, sẽ nhận ra rằng có những nơi có thể không cần cấu trúc phức tạp như vậy, từ đó có thể giảm giá. Tổng thể, có thể giảm từ năng lượng, chip, đến thuật toán.”

Điều này mâu thuẫn với đợt tăng giá của các nhà cung cấp đám mây hiện nay, Lô Quốc Chiêu cho biết, bản chất của mâu thuẫn này là sự chuyển đổi mô hình kinh doanh, cũng là hành vi thị trường. “Trước khi ‘cua ghẹ’ xuất hiện, ý chí của người dùng cá nhân trả phí Token rất thấp, lúc đó lượng tiêu thụ ít, biến động nhỏ, người dùng dùng miễn phí là điều các nhà cung cấp đám mây chấp nhận được. Nhưng ‘cua ghẹ’ liên tục tiêu hao lượng lớn Token, tất nhiên không thể miễn phí nữa, các nhà cung cấp đám mây còn có thể dựa vào nhu cầu của người dùng để điều chỉnh chiến lược giá.”

Thực tế, cách đây hai tháng, đợt tăng giá này đã bắt đầu. Ngày 22 tháng 1, AWS công bố tăng 15% giá cho EC2 dùng để huấn luyện các mô hình lớn. Ngày 27 tháng 1, Google Cloud thông báo sẽ tăng giá các dịch vụ truyền dữ liệu, AI và hạ tầng tính toán, mức tăng cao nhất lên tới 100%.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim