Token sử dụng tăng 10 lần trong một năm, không lạ khi các nhà cung cấp phải tăng giá

robot
Đang tạo bản tóm tắt

Dưới tác động của sự bùng nổ nhu cầu AI toàn cầu, tình trạng khan hiếm tài nguyên tính toán và chi phí phần cứng tăng cao, các nhà cung cấp mô hình lớn và dịch vụ đám mây gần đây đã đồng loạt tăng giá.

Ngày 11 tháng 3, Tencent Cloud là đơn vị đầu tiên điều chỉnh chiến lược tính phí, giá đầu vào của mô hình dòng Mixed Yuan Tencent HY2.0 Instruct từ 0,0008 nhân dân tệ/1.000 Tokens đã tăng lên 0,004505 nhân dân tệ/1.000 Tokens, mức tăng 463%; đồng thời kết thúc giai đoạn thử nghiệm miễn phí của các mô hình bên thứ ba như GLM 5, MiniMax, chuyển sang thương mại chính thức.

Ngày 16 tháng 3, Zhipu ra mắt mô hình mới GLM-5-Turbo và tăng giá API thêm 20%, mức tăng trung bình so với phiên bản trước là GLM-4.7 đạt 83%.

Ngày 18 tháng 3, Alibaba Cloud và Baidu Smart Cloud cùng ngày đều công bố tăng giá. Theo thông báo chính thức, Alibaba Cloud sẽ điều chỉnh giá các dịch vụ liên quan đến card tính toán như PingTouGe ZhenWu 810E và các dịch vụ CPFS (phiên bản trí tuệ nhân tạo), mức tăng cao nhất lên tới 34%; Baidu Smart Cloud cũng rõ ràng cho biết giá các sản phẩm dịch vụ liên quan đến năng lực tính toán AI sẽ tăng khoảng 5%—30%, và giá các dịch vụ lưu trữ tệp tin song song cũng tăng khoảng 30%. Cả hai nhà cung cấp đám mây đều cho rằng việc tăng giá là do “sự bùng nổ nhu cầu AI toàn cầu”.

Mặc dù tổng thể nhu cầu AI toàn cầu không dễ ước lượng, nhưng có thể nhìn thấy phần nào qua dữ liệu do nền tảng tổng hợp API lớn nhất thế giới OpenRouter tiết lộ. Theo giới thiệu, OpenRouter là một nền tảng API tổng hợp nhiều mô hình trí tuệ nhân tạo, người dùng phổ thông và các nhà phát triển đều có thể truy cập qua một giao diện thống nhất để gọi các mô hình LLM khác nhau để trò chuyện, ví dụ như GPT-4, Claude, Gemini, Deepseek, v.v.

Dữ liệu do OpenRouter tiết lộ cho thấy, trong tuần từ ngày 24 tháng 3 năm 2025, lượng Token sử dụng để gọi các mô hình lớn qua nền tảng này là 1,62 nghìn tỷ, còn đến tuần ngày 9 tháng 3 năm nay, con số này đã tăng lên 16,90 nghìn tỷ, gấp 10 lần chỉ trong một năm. Đặc biệt, kể từ khi OpenClaw (“Tôm hùm”) chính thức ra mắt vào ngày 30 tháng 1 năm nay, tốc độ tăng lượng Token sử dụng còn rõ rệt hơn. Trong tuần ra mắt OpenClaw, lượng Token sử dụng trên nền tảng này là 8,25 nghìn tỷ, chỉ sau hơn một tháng, con số này đã nhân đôi lên 16,90 nghìn tỷ.

Báo cáo nghiên cứu của Galaxy Securities cho biết, vào tuần đầu tiên của tháng 3 năm 2026, lượng xử lý của nền tảng đạt 14,8 nghìn tỷ Token, gấp đôi so với tuần đầu năm, trong đó hơn một nửa lượng Token xuất ra là do các luồng công việc do Agent điều khiển.

Ngoài ra, dựa trên dữ liệu cụ thể về lượng Token sử dụng trong tuần ngày 9 tháng 3, có bốn mô hình lớn nội địa chiếm lĩnh bảng xếp hạng. MiniMax M2.5 đứng đầu với 1,75 nghìn tỷ, Step 3.5 Flash (Ngôi sao bước nhảy) và DeepSeek V3.2 lần lượt xếp thứ hai và thứ ba với 1,34 nghìn tỷ và 1,04 nghìn tỷ, còn Kimi K2.5 xếp thứ chín với 0,56 nghìn tỷ. Hơn nữa, kể từ tuần ngày 9 tháng 2, khi lượng gọi mô hình Trung Quốc lần đầu vượt Mỹ, MiniMax M2.5 đã liên tiếp giữ vị trí số một trong 5 tuần liên tiếp.

Mặc dù OpenRouter chỉ thống kê các lượt gọi qua nền tảng, chưa tính đến các người dùng trực tiếp dùng API của nhà sản xuất, nhưng với tư cách là nền tảng tổng hợp API lớn nhất toàn cầu, các dữ liệu này vẫn cho thấy sức mạnh và nhu cầu lớn của các mô hình nội địa.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Gate Fun hot

    Xem thêm
  • Vốn hóa:$2.34KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$0.1Người nắm giữ:1
    0.00%
  • Vốn hóa:$2.33KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.33KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.32KNgười nắm giữ:1
    0.00%
  • Ghim