Cơ bản
Giao ngay
Giao dịch tiền điện tử một cách tự do
Giao dịch ký quỹ
Tăng lợi nhuận của bạn với đòn bẩy
Chuyển đổi và Đầu tư định kỳ
0 Fees
Giao dịch bất kể khối lượng không mất phí không trượt giá
ETF
Sản phẩm ETF có thuộc tính đòn bẩy giao dịch giao ngay không cần vay không cháy tải khoản
Giao dịch trước giờ mở cửa
Giao dịch token mới trước niêm yết
Futures
Truy cập hàng trăm hợp đồng vĩnh cửu
TradFi
Vàng
Một nền tảng cho tài sản truyền thống
Quyền chọn
Hot
Giao dịch với các quyền chọn kiểu Châu Âu
Tài khoản hợp nhất
Tối đa hóa hiệu quả sử dụng vốn của bạn
Giao dịch demo
Giới thiệu về Giao dịch hợp đồng tương lai
Nắm vững kỹ năng giao dịch hợp đồng từ đầu
Sự kiện tương lai
Tham gia sự kiện để nhận phần thưởng
Giao dịch demo
Sử dụng tiền ảo để trải nghiệm giao dịch không rủi ro
Launch
CandyDrop
Sưu tập kẹo để kiếm airdrop
Launchpool
Thế chấp nhanh, kiếm token mới tiềm năng
HODLer Airdrop
Nắm giữ GT và nhận được airdrop lớn miễn phí
Pre-IPOs
Mở khóa quyền truy cập đầy đủ vào các IPO cổ phiếu toàn cầu
Điểm Alpha
Giao dịch trên chuỗi và nhận airdrop
Điểm Futures
Kiếm điểm futures và nhận phần thưởng airdrop
Đầu tư
Simple Earn
Kiếm lãi từ các token nhàn rỗi
Đầu tư tự động
Đầu tư tự động một cách thường xuyên.
Sản phẩm tiền kép
Kiếm lợi nhuận từ biến động thị trường
Soft Staking
Kiếm phần thưởng với staking linh hoạt
Vay Crypto
0 Fees
Thế chấp một loại tiền điện tử để vay một loại khác
Trung tâm cho vay
Trung tâm cho vay một cửa
Từ giảm giá tập thể đến tăng giá tập thể, tại sao “Kinh tế Token” lại thay đổi hướng gió trong hai năm
Hỏi AI · Ứng dụng trí tuệ nhân tạo có thể bùng nổ nhu cầu Token như thế nào?
Token là “tiền tệ mới” của thời đại AI. Năm 2024, cuộc chiến giá AI bắt đầu, Token được định giá theo “li”; đến năm 2026, nhu cầu tính toán bùng nổ, các nhà sản xuất mô hình và nhà cung cấp đám mây đồng loạt tăng giá Token.
Trong hai năm qua, ngành công nghiệp mô hình lớn đã trải qua sự chuyển đổi mạnh mẽ từ chiến tranh về giá sang chiến tranh về giá trị, giá trị của Token đang được xem xét lại. Ngoài lương, thưởng, cổ phần, Token thậm chí trở thành quân cờ mới trong đàm phán lương của kỹ sư Silicon Valley. Cuộc chiến về hệ sinh thái và tranh giành tài nguyên xoay quanh Token đã chính thức bắt đầu.
Từ làn sóng giảm giá đến làn sóng tăng giá
Đến năm 2026, các nhà sản xuất mô hình và nhà cung cấp đám mây đồng loạt tăng giá Token. Trong năm nay, Zhipu đã hai lần phát hành thông báo tăng giá. Ngày 16 tháng 3, Zhipu ra mắt mô hình nền GLM-5-Turbo tối ưu sâu cho kịch bản OpenClaw, giá API tăng 20%. Trong gói “Tôm hùm” dành cho người dùng cá nhân và doanh nghiệp, thẻ tháng trải nghiệm Claw là 39 nhân dân tệ/tháng, gồm 35 triệu Token, thẻ tháng nâng cao của Claw là 99 nhân dân tệ/tháng, gồm 100 triệu Token. Tháng 2, Zhipu công bố điều chỉnh giá Coding Plan, “do nhu cầu thị trường đối với Coding Plan của GLM liên tục tăng mạnh, quy mô người dùng và số lần gọi API tăng nhanh”, quyết định hủy ưu đãi mua lần đầu, giữ ưu đãi đăng ký theo quý hoặc theo năm, mức tăng giá chung của gói dịch vụ từ 30% trở lên.
Ngoài các nhà sản xuất mô hình, các nhà cung cấp đám mây cũng đồng loạt tăng giá. Do nhu cầu đăng ký Coding Plan bùng nổ, Alibaba Cloud đã tăng đột biến số lượng gọi API mô hình, ngày 4 tháng 3 thông báo điều chỉnh tạm thời ưu đãi mua lần đầu, cung cấp theo thời gian giới hạn hàng ngày, có hạn và hết hàng. Ngày 18 tháng 3, Alibaba Cloud cho biết, do nhu cầu AI toàn cầu bùng nổ, chuỗi cung ứng tăng giá, chi phí mua sắm phần cứng cốt lõi của ngành tăng rõ rệt, từ ngày 18 tháng 4 sẽ điều chỉnh giá các dịch vụ tính toán AI, CPFS (phiên bản trí tuệ) và các dịch vụ khác. Các dịch vụ liên quan đến card tính toán như Pingtouge Zhenwu 810E tăng từ 5% đến 34%, CPFS (phiên bản trí tuệ) tăng 30%.
Bộ Dịch vụ Đám mây Thông minh Baidu cũng tuyên bố, từ ngày 18 tháng 4, các sản phẩm dịch vụ liên quan đến tính toán AI sẽ tăng khoảng 5%-30%, lưu trữ tệp song song cũng tăng khoảng 30%. Tencent Cloud thông báo từ ngày 13 tháng 3, mô hình GLM 5, MiniMax 2.5, Kimi 2.5 kết thúc thử nghiệm công khai, chuyển sang dịch vụ thương mại chính thức, tính phí theo số lần gọi mô hình. Các mô hình dòng Hỗn Nguyên cũng có điều chỉnh giá, giá đầu vào của mô hình Tencent HY2.0 Instruct từ 0.0008 nhân dân tệ/nghìn tokens tăng lên 0.004505 nhân dân tệ/nghìn tokens, giá đầu ra từ 0.002 nhân dân tệ/nghìn tokens tăng lên 0.01113 nhân dân tệ/nghìn tokens.
Tuy nhiên, cách đây hai năm, làn sóng giảm giá Token còn in đậm trong ký ức.
Trong cuộc “Chiến tranh mô hình trăm” năm 2024, ngành mô hình lớn vẫn còn trong cuộc chiến giá khốc liệt, các nhà cung cấp đám mây và nhà sản xuất mô hình cạnh tranh giảm giá, tặng Token.
Tháng 5 năm đó, ByteDance đã kích hoạt cuộc chiến giá mô hình lớn với mức giá 0.0008 nhân dân tệ/nghìn tokens, sau đó Alibaba Cloud theo chân, công bố giảm giá tối đa 97% cho Quỳ Quỳ Thập Nhất. Thời điểm đó, mô hình chính của Quỳ Quỳ Thập Nhất GPT-4 cấp Qwen-Long có giá đầu vào từ 0.02 nhân dân tệ/nghìn tokens giảm xuống còn 0.0005 nhân dân tệ/nghìn tokens. Cùng kỳ, số lượng Token tặng cho người dùng mới của Zhipu tăng từ 5 triệu lên 25 triệu Token.
DeepSeek, một công ty đào tạo mô hình hiệu suất cao với chi phí thấp, đã tiết lộ vào tháng 3 năm ngoái các thông tin then chốt về hệ thống suy luận V3/R1 của họ, qua tối ưu hóa thông lượng và độ trễ, nếu tính theo giá của DeepSeek-R1, lợi nhuận chi phí có thể đạt 545%.
Công nghệ là nền tảng để giảm giá mô hình. Chủ tịch Tần Đợi của Volcano Engine, nền tảng dịch vụ đám mây của ByteDance, từng nói trong làn sóng giảm giá AI năm 2024 rằng, logic cơ bản của việc giảm giá là tự tin dùng các biện pháp công nghệ để giảm chi phí, thị trường cũng cần các mô hình lớn với giá thấp hơn.
“Hai năm trước, nhu cầu tính toán chủ yếu là doanh nghiệp, giờ đây là ‘đói’ tính toán của cá nhân, thúc đẩy các công ty khởi nghiệp AI và các tập đoàn lớn chuyển đổi mô hình kinh doanh sang tiêu thụ Token,” ông Tiền Phong, Viện trưởng Viện Nghiên cứu Trí tuệ Nhân tạo của Quang Tư, nhận định.
Trong hai năm qua, mô hình đã tiến bộ nhanh chóng, ứng dụng trí tuệ nhân tạo tăng mạnh, từ đó thúc đẩy nhu cầu tính toán liên tục tăng, khả năng sản xuất card suy luận hiệu suất cao có hạn, chi phí phần cứng cốt lõi như bộ nhớ và hạ tầng liên quan tăng rõ rệt. Giám đốc điều hành Bernard Golden của Navica, công ty phân tích, tư vấn và đầu tư công nghệ Silicon Valley, cho biết toàn ngành đang điên cuồng tìm kiếm nhiều năng lực tính toán hơn.
Trong bối cảnh cung cầu mất cân đối, tăng giá là điều tất yếu.
“Một mô hình thông minh hơn thực hiện các nhiệm vụ phức tạp hơn, tiêu thụ nhiều tài nguyên hơn,” CEO Zhipu, Trương Bằng, gần đây nói về chiến lược tăng giá, rằng, việc thực thi nhiệm vụ của trí tuệ nhân tạo liên quan đến chuỗi suy luận và suy nghĩ dài hơn, còn tương tác với hạ tầng nền tảng qua viết mã, liên tục điều chỉnh và sửa lỗi, lượng Token cần để hoàn thành một nhiệm vụ gấp 10 đến 100 lần câu hỏi đơn giản. Bản chất của điều chỉnh giá là chi phí đang thay đổi, “mô hình càng lớn, khả năng càng mạnh, dịch vụ tương ứng cũng tăng, vì vậy chúng tôi muốn đưa nó trở lại một phạm vi giá trị thương mại bình thường, dựa vào giá thấp lâu dài không có lợi cho sự phát triển của ngành.”
Nhu cầu gọi Token tăng nghìn lần trong hai năm
Trong hai năm qua, các nhà cung cấp phần mềm đã tích hợp dần các khả năng tạo văn bản, hình ảnh, giọng nói vào các nền tảng dịch vụ khách hàng, tạo nội dung marketing, robot dịch vụ qua các API tiêu chuẩn, giảm rào cản sử dụng và đầu tư ban đầu. Doanh nghiệp gọi API để sử dụng mô hình lớn, tính phí theo số lần gọi hoặc theo đăng ký, giúp giảm thiểu rào cản và chi phí ban đầu. Dù vậy, chi phí cho một GPU H100 đơn là khoảng 25.000 USD, chi phí cho một hệ thống nhiều GPU còn cao hơn.
Mô hình dịch vụ này giúp mô hình lớn nhanh chóng tiếp cận hàng tỷ người dùng, lượng gọi Token tăng vọt. Mới đây, trưởng Cục Dữ liệu Quốc gia Liu Liehong tiết lộ, đến cuối năm 2025, đã xây dựng hơn 100.000 bộ dữ liệu chất lượng cao. Đến tháng 3 năm nay, lượng gọi Token trung bình hàng ngày của Trung Quốc đã vượt quá 140 nghìn tỷ, tăng hơn 1000 lần so với đầu năm 2024, và tăng hơn 40% so với cuối năm 2025.
Ông Tiền Phong nói với Pengpai Tech rằng, năm 2024, nhu cầu tính toán để huấn luyện vượt quá 50%, đến năm 2025, tình hình hoàn toàn đảo ngược. Nếu hai năm trước là cuộc chiến trăm “mô hình”, thì bây giờ là cuộc chiến trăm “tôm hùm”.
Nhu cầu suy luận bùng nổ, dịch vụ suy luận và tiêu thụ Token gắn kết chặt chẽ là các lĩnh vực tính toán lớn nhất và tăng trưởng nhanh nhất hiện nay. Hiệu suất mô hình liên tục nâng cao thúc đẩy lượng tiêu thụ Token tăng vọt, các ứng dụng trí tuệ nhân tạo như “龙虾” (OpenClaw) lan rộng khiến nhu cầu Token bùng nổ. OpenClaw bị gọi vui là “hố đen Token”. Đối với các doanh nghiệp và cá nhân sử dụng “龙虾”, Token là rào cản chi phí lớn nhất.
Ông Tiền Phong cho biết, lượng Token tiêu thụ khi trí tuệ nhân tạo tự động thực hiện nhiệm vụ là gấp 4-15 lần so với hỏi đáp truyền thống. Nhà sáng lập startup AI Luo Xuan dùng OpenClaw để hoàn thành các nhiệm vụ phức tạp cần tiêu tốn hàng triệu hoặc nhiều hơn Token. Để tìm Token rẻ hơn, anh ấy thường đăng ký tài khoản mới của các nhà cung cấp đám mây hoặc mô hình, lấy Token miễn phí, nhưng vẫn than thở “Token quá đắt”.
Các hoạt động lập trình, trò chuyện, làm việc văn phòng tiêu thụ dựa trên Token, xét theo tiêu chuẩn tiêu thụ năng lực tính toán rộng hơn, như tạo hình ảnh dựa trên số lượng hình, hoặc tạo video dựa trên thời lượng và độ phân giải cũng tiêu tốn nhiều năng lực tính toán. Ví dụ, OpenAI đóng cửa ứng dụng video Sora là minh chứng. Việc vận hành dịch vụ tạo video tiêu tốn tài nguyên tính toán và điện năng khổng lồ, điều này đối với bất kỳ doanh nghiệp nào cũng là khoản chi lớn, và việc đóng Sora giúp giải phóng nhiều tài nguyên tính toán.
Nhu cầu tính toán không chỉ thúc đẩy sự tăng trưởng của GPU, mà tất cả các phần cứng liên quan cũng sẽ dao động theo, trở thành một yếu tố hạn chế.
“Bao gồm làm mát, chiếu sáng, điện cho máy chủ, chi phí điện năng của trung tâm dữ liệu chiếm khoảng 60%, hiện nay giá năng lượng như dầu mỏ, khí tự nhiên đều tăng, bộ nhớ có chu kỳ tăng giá 5 năm,” ông Tiền Phong nói. Chi phí năng lượng và phần cứng thúc đẩy giá tính toán tăng.
Giám đốc điều hành toàn cầu của Cisco, Huang Zhiming, cho biết trong Pengpai Tech rằng, trong ngắn hạn, đầu tư phần cứng để xây dựng nhà máy không thể hoàn thành trong một hoặc hai tháng, biến động cung cầu vẫn sẽ kéo dài một thời gian. Phó Tổng Giám đốc cao cấp và Giám đốc Công nghệ của Cisco Greater China, Hou Shengli, bổ sung rằng, để đáp ứng đủ nhu cầu cần khoảng hai năm, “việc điều chỉnh nhà máy bộ nhớ ít nhất cũng mất hai năm, trước cuối năm 2027 sẽ chưa có chuyển biến tốt, xây dựng lại nhà máy, bố trí dây chuyền sản xuất không thể nhanh như vậy.” Tuy nhiên, ông Huang Zhiming cho rằng, cùng với mở rộng quy mô người dùng và phổ biến ứng dụng, chi phí sẽ dần trở nên phổ biến và rẻ hơn.
Nhà cung cấp dịch vụ đám mây AI PiaoYun (Thượng Hải) do Yao Xin sáng lập, nói với Pengpai Tech rằng, ngày nay, giới hạn của AI và năng lực tính toán không phải là chip cao cấp nhất, mà là các công nghệ IT phổ thông, các linh kiện truyền thống. Trong 10 năm qua, ngành công nghiệp hạ tầng IT truyền thống như bộ nhớ, ổ cứng, switch đã duy trì tăng trưởng đều đặn theo tốc độ tăng trưởng của GDP toàn cầu, dự đoán nhu cầu dài hạn đã quyết định tốc độ mở rộng năng lực sản xuất nhẹ nhàng. Nhưng sự bùng nổ của trí tuệ nhân tạo đã phá vỡ cân bằng này. Lượng xuất xưởng GPU tăng vọt, các linh kiện phụ trợ trong chuỗi cung ứng bị bỏ lại phía sau trong nhu cầu “đột biến” này. “Chíp cao cấp đã mở rộng sản xuất, nhưng các năng lực khác chưa theo kịp. Tất cả mọi người đều bị tổn thương trong đợt này, vì vậy các linh kiện truyền thống như bộ nhớ, ổ cứng đều mở rộng sản xuất.”
Cung cầu luân phiên tăng trưởng, cuối cùng đi đến cân bằng
“Hiện tại Token đắt hơn thực tập sinh, sau 3-5 năm chắc chắn sẽ rẻ hơn,” ông Tiền Phong cũng cho rằng, giá Token trong tương lai chắc chắn sẽ giảm.
Ông cho rằng, trong ngắn hạn, giá tính toán tăng do mất cân đối cung cầu. Nhưng theo chu kỳ bán dẫn, ngành sản xuất có chu kỳ năng lực, sau khi mở rộng sản xuất, năng lực mới tập trung giải phóng, thị trường bị tác động, giá giảm, thậm chí dư thừa năng lực. Về năng lượng, Trung Quốc đang thúc đẩy chuyển đổi cấu trúc năng lượng mới, có khả năng giảm chi phí năng lượng hơn nữa. Về trung hạn, giá sẽ phụ thuộc vào khả năng nâng cấp của mô hình chính – các phiên bản mới ra mắt mỗi 3 tháng thường giải quyết các nhu cầu chưa được đáp ứng trước đó, kích thích nhu cầu mới, đẩy giá tính toán lên; về dài hạn, phụ thuộc vào sự tiến bộ của khả năng suy luận, cuối cùng dẫn đến giảm liên tục chi phí tính toán.
Trong hai năm, cung và cầu luân phiên tăng trưởng. Ông Tiền Phong nói rằng, DeepSeek là đỉnh cao của đổi mới giảm chi phí, còn “tôm hùm” (OpenClaw) là đỉnh của bùng nổ năng suất, tạo ra đỉnh cầu. “Nhưng điều này không có nghĩa là khi cầu bùng nổ, chi phí suy luận không giảm, chỉ là tốc độ bùng nổ nhanh hơn tốc độ giảm chi phí của suy luận. Trong 3-5 năm tới, tổng chi phí tính toán và phí Token sẽ giảm mạnh.”
Yao Xin nói rằng, AI đã bước vào “điểm kỳ dị”, “trong vòng một hoặc hai năm tới, sẽ có sự tăng trưởng nhanh gấp 10-100 lần, tất cả các ngành chưa chuẩn bị tốt để đối mặt với sự tăng trưởng này sẽ gặp phải tình trạng cung không đủ cầu trong ngắn hạn. Nhưng giống như gợn sóng lan rộng chậm, cuối cùng sẽ đi đến cân bằng.”
Sau sự tăng giá của Token, logic thương mại cũng đang thay đổi. CEO Nvidia, Huang Renxun, từng nhiều lần đề cập đến cấu trúc “ngũ tầng bánh kem” của AI, “ngũ tầng bánh kem” từ dưới lên gồm năng lượng, chip, hạ tầng, mô hình và ứng dụng, phần trên cùng là các ứng dụng sẽ mang lại lợi nhuận kinh tế lớn nhất.
“Hiện tại AI giống như thời kỳ Internet năm 2000, lúc đó cũng chưa rõ Internet có thể làm gì, nhưng vô số người đã dấn thân vào xây dựng các trang web.” Phó Chủ tịch Hou Shengli nói, cùng với ứng dụng và đổi mới liên tục, đến năm 2005, 2006, các ứng dụng ‘Internet +’ ngày càng nhiều, các dịch vụ dần hòa quyện. Hướng phát triển của AI cũng rất đáng kỳ vọng, như dự đoán phổ biến, năm 2026 sẽ trở thành năm của trí tuệ nhân tạo, năm nay các ứng dụng trí tuệ nhân tạo sẽ liên tục xuất hiện.
Các ứng dụng trí tuệ nhân tạo này đang hòa nhập vào điện thoại, máy tính, thậm chí dây chuyền sản xuất nhà máy. “Nhu cầu nâng cao năng suất của mọi người đối với AI gần như là vô hạn, giới hạn duy nhất là giá cả. Tăng giá, nhu cầu giảm; giảm giá, nhu cầu tăng,” ông Tiền Phong nói. Ngay cả bây giờ, các tập đoàn lớn cũng không đồng đều trong việc tăng giá. “Các tập đoàn một mặt tăng giá dịch vụ đám mây cho B2B, mặt khác dùng chiến lược thử miễn phí hoặc tặng Token để chiếm lĩnh thị trường C2C,” ông thẳng thắn. Hiện tại, tình hình giống như thời kỳ đầu của Internet, mục tiêu cuối cùng của các tập đoàn lớn là thu hút người dùng, nhưng quan trọng hơn là tranh giành các nhà phát triển.
Trước đây, các nhà phát triển là lập trình viên toàn cầu, nay, nhiều người không kỹ thuật cũng có khả năng Vibe Coding (lập trình trong không khí). Họ vừa là người tiêu thụ mã, vừa là người sáng tạo mã. Các tập đoàn lớn giữ chân các nhà phát triển, để kết quả phát triển có thể “bám” trên đám mây của chính họ.
Các tập đoàn lớn trong ngành Internet cung cấp Token cho nhân viên, khuyến khích sử dụng AI. Theo báo giới, Alibaba đang thúc đẩy một kế hoạch nội bộ, cung cấp Token cho nhân viên, khuyến khích họ sử dụng các mô hình và công cụ AI tiên tiến trong công việc. Nhân viên Alibaba có thể dùng miễn phí các công cụ AI trả phí như Wukong, nền tảng lập trình trí tuệ nhân tạo Qoder, để nghiên cứu kỹ thuật và làm việc chung, công ty sẽ cấp Token cho nhân viên. Nhân viên mua gói thành viên Coding Plan hoặc các công cụ phát triển AI bên ngoài có thể xin hoàn trả.
Các hoạt động nâng cao hiệu quả bằng AI không chỉ giới hạn trong lập trình, mà còn mở rộng đến sáng tạo nội dung và công việc chuyên nghiệp, đều có nhu cầu Token. MiniMax thậm chí nâng cấp gói Coding Plan cũ thành Token Plan hỗ trợ mô hình đa dạng MiniMax, nắm bắt cơ hội Token.
“Thành thật mà nói, làm mô hình chưa tìm ra nhiều nhu cầu thực sự, nên đa phần áp dụng mô hình thuê bao hàng tháng. Token được chú ý vì các chỉ số như tăng trưởng người dùng hàng tháng, tiêu thụ trung bình Token của mỗi người dùng thể hiện rõ tốc độ doanh thu tăng trưởng,” ông Tiền Phong nói. Điều này tạo ra tính gắn kết cực kỳ cao của người dùng, chỉ cần sản phẩm đủ tốt, dù giá cao hơn một chút, người dùng vẫn sẵn sàng trả tiền để có trải nghiệm tốt hơn. Hơn nữa, cùng 5 triệu Token, có thể bán với giá 22 nhân dân tệ hoặc 400 nhân dân tệ, giá trị chênh lệch liên quan trực tiếp đến khả năng của mô hình nền và trí tuệ nhân tạo. Ông Tiền Phong nhấn mạnh, về bản chất, phía sau Token là một mỏ vàng chưa được khai thác hết.