Cơ bản
Giao ngay
Giao dịch tiền điện tử một cách tự do
Giao dịch ký quỹ
Tăng lợi nhuận của bạn với đòn bẩy
Chuyển đổi và Đầu tư định kỳ
0 Fees
Giao dịch bất kể khối lượng không mất phí không trượt giá
ETF
Sản phẩm ETF có thuộc tính đòn bẩy giao dịch giao ngay không cần vay không cháy tải khoản
Giao dịch trước giờ mở cửa
Giao dịch token mới trước niêm yết
Futures
Truy cập hàng trăm hợp đồng vĩnh cửu
TradFi
Vàng
Một nền tảng cho tài sản truyền thống
Quyền chọn
Hot
Giao dịch với các quyền chọn kiểu Châu Âu
Tài khoản hợp nhất
Tối đa hóa hiệu quả sử dụng vốn của bạn
Giao dịch demo
Giới thiệu về Giao dịch hợp đồng tương lai
Nắm vững kỹ năng giao dịch hợp đồng từ đầu
Sự kiện tương lai
Tham gia sự kiện để nhận phần thưởng
Giao dịch demo
Sử dụng tiền ảo để trải nghiệm giao dịch không rủi ro
Launch
CandyDrop
Sưu tập kẹo để kiếm airdrop
Launchpool
Thế chấp nhanh, kiếm token mới tiềm năng
HODLer Airdrop
Nắm giữ GT và nhận được airdrop lớn miễn phí
Launchpad
Đăng ký sớm dự án token lớn tiếp theo
Điểm Alpha
Giao dịch trên chuỗi và nhận airdrop
Điểm Futures
Kiếm điểm futures và nhận phần thưởng airdrop
Đầu tư
Simple Earn
Kiếm lãi từ các token nhàn rỗi
Đầu tư tự động
Đầu tư tự động một cách thường xuyên.
Sản phẩm tiền kép
Kiếm lợi nhuận từ biến động thị trường
Soft Staking
Kiếm phần thưởng với staking linh hoạt
Vay Crypto
0 Fees
Thế chấp một loại tiền điện tử để vay một loại khác
Trung tâm cho vay
Trung tâm cho vay một cửa
“Token” kinh tế học: AI cần tính toán lại chi phí
Nguồn: Tờ Bắc Kinh Thương Báo
“Token” đang trở thành từ khóa nóng nhất trong ngành AI. Tại Hội nghị Thượng Hải Làng Chương 2026 (Diễn đàn Trung Quan Thôn) được tổ chức gần đây, phần thảo luận xoay quanh nó không thể tránh khỏi giữa người sáng lập kiêm CEO Kimi là Dương Thực Lân và CEO Trương Bằng của Zhipu. Dương Thực Lân định nghĩa Token là GDP trong tương lai, còn Trương Bằng thẳng thắn nói “cạnh tranh bằng giá thấp trong dài hạn không có lợi cho sự phát triển của ngành”. Cách hơn 1000 km, Phó chủ tịch điều hành cấp cao kiêm Tổng giám đốc cấp cao Tencent là Tô Đạo Sinh và Phó tổng giám đốc Lý Cường cũng lần lượt đề cập đến Token: người trước cho rằng “trong cùng năng lực mô hình, thiết kế Harness (giàn giáo) khác nhau khiến chi phí Token chênh lệch rất lớn”, người sau lại cho rằng việc chuyển Token rất dễ, độ bám dính yếu, khi dừng trợ cấp thì khách hàng cũng rất dễ bị mất. Khi OpenClaw (biệt danh của cư dân mạng “tôm hùm”) khiến mức tiêu hao Token bùng nổ theo cấp số nhân, Token không còn chỉ là thuật ngữ kỹ thuật nữa, mà trở thành biến số then chốt liên quan đến mô hình kinh doanh.
“Đốt thủng” chi phí của Token
Làn sóng tác nhân thông minh do “tôm hùm” khởi xướng khiến lượng tiêu hao Token bùng nổ theo cấp số nhân. Token là gì? Theo định nghĩa của Cục Dữ liệu Quốc gia, Token là đơn vị nhỏ nhất để mô hình AI xử lý thông tin; Token có thể đo lường, định giá và giao dịch được.
Trương Đình, phụ trách sản phẩm của nền tảng Baidu Qianfan, giải thích với phóng viên Bắc Kinh Thương Báo rằng: “Nó không hoàn toàn bằng một chữ, cũng không hoàn toàn bằng một từ, mà là một loại ‘mảnh ghép ngôn ngữ’ nằm giữa hai khái niệm đó. Ví dụ, chữ Hán ‘tôi’ là một Token, ‘hôm nay’ có thể là một Token, nhưng ‘quốc tế hóa’ có thể bị tách thành ‘quốc tế’ và ‘hóa’—tức hai Token. Vì ngôn ngữ mà mô hình lớn đối mặt là mang tính toàn cầu, Token là một dạng ‘ước số chung lớn nhất’ phổ dụng, giúp mô hình có thể xử lý mọi ngôn ngữ và ký hiệu bằng một cách thống nhất.”
Theo thông tin từ Cục Dữ liệu Quốc gia, từ đầu năm 2024, lượng gọi Token hằng ngày trung bình của Trung Quốc đạt 100 tỉ; đến cuối năm 2025, nhảy vọt lên 100 nghìn tỉ; đến tháng 3 năm 2026 đã vượt 140 nghìn tỉ, trong hai năm tăng hơn 1000 lần.
Phản ứng của các nhà cung cấp đám mây và doanh nghiệp mô hình AI bắt đầu từ tháng 2: Zhipu hủy ưu đãi mua ban đầu cho GLM Coding Plan, mức giá của cả gói tăng tổng thể từ 30% trở lên. Đầu tháng 3, Tencent Cloud đã điều chỉnh tăng giá của hai mô hình do tự nghiên cứu; trong đó mô hình Tencent HY2.0 Instruct có mức tăng 463%. Cuối tháng, Alibaba Cloud và Baidu Intelligent Cloud công bố tăng giá năng lực tính toán AI cùng ngày, mức tăng cao nhất 34%.
Về chuỗi logic khiến tác nhân thông minh trở nên “hot” và dẫn đến tăng trưởng tiêu hao Token, Trương Bằng gần đây đã giải thích chi tiết: Khi Agent đối mặt với các nhiệm vụ phức tạp, chuỗi suy nghĩ của mô hình rất dài, lượng tiêu hao Token rất lớn và chi phí suy luận của mô hình cũng vì thế tăng tương ứng. Do đó, đưa giá Token về lại giá trị thương mại bình thường. Cạnh tranh lâu dài bằng giá thấp cũng không có lợi cho sự phát triển của cả ngành.
Trong cuộc phỏng vấn với phóng viên Bắc Kinh Thương Báo và các đơn vị truyền thông khác, Lý Cường cho biết: “Tính kinh tế của Token rất nhanh cũng sẽ được mọi khách hàng chú ý đến; nếu chỉ cân nhắc lượng tiêu hao mà không cân nhắc tính kinh tế, có thể giá hoặc chi phí ở phía người dùng của bạn sẽ cao hơn. Điều này sẽ ảnh hưởng tiêu cực đến sự phát triển dài hạn và lành mạnh của công ty.”
Harness “giàn giáo” nằm dưới mặt nước
Token rốt cuộc được định giá như thế nào? Trương Đình đưa ví dụ để phóng viên Bắc Kinh Thương Báo cùng phân tích: “Ví dụ, ‘Hôm nay thời tiết ở Bắc Kinh như thế nào’, cộng với câu trả lời của AI, thì khoảng tiêu hao 50–100 Token. Nếu bạn để AI viết một bài văn 800 chữ, tính cả các lệnh nhắc của bạn và toàn bộ đầu ra hoàn chỉnh, thì khoảng tiêu hao 1000–1500 Token”. “Quy đổi thành tiền: hiện tại, giá của các mô hình chủ đạo trên nền tảng Baidu Qianfan ở mức vài chục xu cho mỗi một triệu Token. Tức là 1 đồng có thể cho AI viết khoảng 1000 bài văn 800 chữ.” Trương Đình nói.
Nhưng khi lượng tiêu hao Token tăng trưởng theo cấp số nhân, một vấn đề sâu hơn lộ ra: không phải tất cả các Token đó đều được dùng vào “phần lưỡi dao”. Token giống như xăng, Agent giống như động cơ xe. Nếu chỉ chú ý đến mức hao xăng mà không chú ý đến tính kinh tế của động cơ và năng lực đầu ra, thì cuối cùng khách hàng cũng sẽ bỏ đi. Lý Cường dùng hao xăng để diễn giải hiệu suất Token.
Lý Địch, người sáng lập Nextie (Mingri Xincheng), cũng là “cha đẻ của Xiaobing”, cũng cho biết với phóng viên Bắc Kinh Thương Báo: “Xu hướng tiêu hao Token nóng lên chỉ ra một hiện tượng thú vị: Tokenmaxxing (tức cuộc thi ‘quét lượng’ Token). Hiện nay nhiều nhà phát triển và công ty đang điên cuồng ‘quét’ lượng tiêu hao Token, thậm chí coi đó như một dạng ‘khoe cơ bắp năng lực tính toán’. Nhưng việc đốt cháy không có giới hạn như vậy sẽ tạo ra sự mất cân bằng ROI (lợi nhuận trên đầu tư) khổng lồ.”
Trong bối cảnh trên, một khái niệm khác là Harness nhanh chóng được chú ý và lan ra ở Thung lũng Silicon lẫn giới kỹ thuật trong nước.
Lý Địch giải thích chi tiết với phóng viên Bắc Kinh Thương Báo rằng, bản dịch thẳng của Harness là “đai ngựa” hoặc “cương ngựa”. Nếu mô hình lớn là một con ngựa hoang sức mạnh vô cùng nhưng không xác định phương hướng, thì Harness chính là hệ thống ràng buộc giúp nó chạy trên một quỹ đạo đã được định sẵn.
“Tôi triển khai AI không chỉ là bài toán thuật toán, mà còn là bài toán kỹ thuật,” Tô Đạo Sinh nêu quan điểm này, “với cùng năng lực mô hình, thiết kế giàn giáo/ Harness khác nhau—ví dụ như cho mô hình gọi công cụ gì, có kỹ thuật ngữ cảnh theo từng lớp hay không, quản lý ghi nhớ dài hạn ra sao, thực hiện quy trình công việc như thế nào—đều có tác động rất lớn đến hiệu quả sử dụng thực tế và chi phí Token.”
La Phúc Ly, phụ trách mô hình lớn của Xiaomi MiMo, khi diễn giải giá trị của OpenClaw cũng nhắc đến danh từ này: “OpenClaw kéo giới hạn trên của các mô hình trong nước vốn ‘mức độ không mở nguồn’ rất nhiều, đồng thời có thể dựa vào một loạt thiết kế như Harness (hệ thống kiểm soát ràng buộc) để đảm bảo mức hoàn thành nhiệm vụ và độ chính xác của mô hình, qua đó giữ vững phần ‘giới hạn dưới’ rất tốt.”
Các nhà cung cấp đám mây xây lại “nền móng”
Cụ thể ở tầng kỹ thuật, nền tảng phát triển tác nhân thông minh ADP của Tencent Cloud, thông qua các năng lực như RAG (sinh dựa trên truy xuất) và cơ sở tri thức, giúp tác nhân kết nối lên “thư viện”, để chuyên gia ngành luôn trực tuyến. Tiếp theo là Claw chạy trong sandbox an toàn của Agent Runtime: Claw như trung tâm thần kinh của hệ thống thông minh, thông qua việc khám phá và tải xuống Skills từ kho kỹ năng, liên tục học tập và tích lũy năng lực kết nối với các hệ thống bên ngoài; dựa vào mô hình lớn để phát và nhận lệnh từ bên ngoài, kích hoạt hành động. Sandbox của AgentRuntime cũng có thể dùng để xác thực kết quả chương trình trong học tăng cường cho mô hình lớn, nâng cao hiệu quả huấn luyện học tăng cường.
Chỉ là một phần rất nhỏ của tảng băng cơ sở hạ tầng.
“Điểm đến của năng lực tính toán có lẽ chính là điện.” Lý Cường tiết lộ trong cuộc phỏng vấn rằng, hai năm trước Tencent bắt đầu khám phá sự phối hợp giữa tính toán và điện năng. Cùng với đối tác, họ sử dụng trực tiếp điện từ điện gió và lưu trữ quang (phát điện gió và lưu trữ năng lượng từ mặt trời) tại Nội Mông để cấp điện cho trung tâm dữ liệu; kết hợp năng lượng hydro và lưu trữ năng lượng để cân bằng đỉnh và đáy của năng lượng sạch, đồng thời điều phối các giai đoạn cao điểm và thấp điểm của năng lực tính toán. Một mặt giảm mạnh chi phí điện, mặt khác giảm phát thải carbon.
Một biến đổi khác diễn ra ở cơ chế điều độ. “Cơ sở hạ tầng của kỷ nguyên điện toán đám mây hiện tại được thiết kế để phục vụ các kỹ sư con người, chứ không phải để phục vụ AI. Về dài hạn, cơ sở hạ tầng nên là một chỉnh thể; toàn bộ hệ thống này phải có thể tự tiến hóa, tự lặp lại, có thể hình thành một tổ chức tự chủ. Tương đương với việc toàn bộ cơ sở hạ tầng do một CEO được công nhận quản lý; nó có thể là một Claw—dựa trên nhu cầu khách hàng AI của nó, tự lặp lại cơ sở hạ tầng của chính mình”, người đồng sáng lập kiêm CEO của Wuwen Qixiong giải thích.
Cần lưu ý rằng hiện nay các nhà cung cấp đám mây hàng đầu đang sở hữu thân phận kép: Alibaba Cloud, Tencent Cloud và Baidu Intelligent Cloud đều vừa là bên cung cấp Token, vừa là bên tiêu hao Token.
Theo mục tiêu mới đây do Alibaba Cloud công bố, trong năm năm tới, doanh thu hằng năm từ thương mại hóa điện toán đám mây và AI sẽ vượt 100 tỉ USD. Đồng thời, Tập đoàn Alibaba cấp hạn mức Token cho nhân viên, khuyến khích nhân viên sử dụng các mô hình AI và công cụ tiên tiến trong công việc.
Lý Cường cho biết: “Token chắc chắn là một trong những chỉ tiêu quản lý rất quan trọng của Tencent Cloud, nhưng không đặt Token ở mức ưu tiên cao nhất; và dùng chính sách thưởng mang tính cực đoan để thúc đẩy. Tencent sẵn sàng tập trung sức lực hơn vào việc nghiên cứu và phát triển động cơ tốt hơn, tạo ra tiêu hao Token thực sự thông qua việc cung cấp sản phẩm AI hữu ích.” Năm 2025, Tencent Cloud đạt lợi nhuận theo quy mô. “Năm 2026 chúng tôi không muốn quá chủ động liều lĩnh,” Lý Cường nói thẳng.
Khi Token 140 nghìn tỉ lao vào ngành, một vòng cạnh tranh khác đã bắt đầu.
Phóng viên Bắc Kinh Thương Báo: Wei Wei
Khối lượng lớn thông tin, phân tích chính xác—tất cả trên ứng dụng Sina Finance APP
Người phụ trách: Gao Jia