AI Token ra biển: Điện rẻ và bức tường không thể vượt qua

Trung Quốc chiếm 61% lượng gọi Token AI toàn cầu, nhưng số tiền kiếm được có thể chưa bằng một phần nhỏ của Anthropic.

Vào một đêm khuya tháng 2 năm 2026, ở Mission District, San Francisco, một lập trình viên gốc Ấn tên Arjun đang nhìn chằm chằm vào hóa đơn trên màn hình. Anh dùng Claude để chạy một quy trình làm việc của một Agent tự động kiểm tra mã. Mười mấy nhiệm vụ phụ chạy song song, lặp đi lặp lại gọi ngữ cảnh, tiêu thụ AI Token không theo tuyến tính mà theo cấp số nhân. Một đêm, vài chục đô đã bị thiêu rụi.

Ngày hôm sau, anh chuyển sang M2.5 của MiniMax, một công ty Trung Quốc, trên nền tảng tổng hợp mô hình AI lớn nhất thế giới OpenRouter. Cùng quy trình làm việc đó, hóa đơn giảm đi một cấp độ. Mã chạy bình thường, kết quả không khác nhiều.

Arjun không biết rằng, mỗi yêu cầu của anh đều xuất phát từ California, xuyên qua cáp quang dưới đáy biển Thái Bình Dương, đến trung tâm dữ liệu ở tỉnh Tây Bắc Trung Quốc. Cụm GPU khởi động, điện năng từ lưới quốc gia chảy vào chip, suy luận hoàn tất, kết quả gửi về, chưa đầy hai giây.

Điện năng chưa từng rời khỏi lưới điện Trung Quốc, nhưng giá trị của điện, qua các mô hình lớn, dưới dạng AI Token, đã ra biển.

Đây không chỉ là lựa chọn của một lập trình viên, mà toàn bộ Silicon Valley đều đang “tối đa hóa token”. Arjun chỉ là hình ảnh thu nhỏ của cơn cuồng nhiệt tiêu thụ AI Token toàn cầu này.

Và bên kia Thái Bình Dương, cảnh tượng hoàn toàn khác biệt.

Cùng năm xuân, trên sa mạc Gobi phía Tây Bắc Trung Quốc, một số trung tâm tính toán từng sôi động hai năm trước đã yên tĩnh lại. Một người đàn ông đã xây dựng trung tâm tính toán nhiều năm, từng nói với tôi trong thời kỳ mọi người đều FOMO:

“Xuất khẩu AI Token không đơn giản như nhiều phương tiện truyền thông nói đâu.”

Ông ấy không đề cập kỹ thuật, mà là vấn đề tiêu hóa. Trung tâm tính toán do các nhà sản xuất mô hình tự xây dựng có thể tự tiêu thụ, đó là con đường tối ưu; nhà mạng viễn thông có kênh để đảm bảo, thứ hai; còn nhóm các nhà tư nhân theo đuổi làn sóng AI, tưởng chừng rực rỡ, thực ra không ai đảm bảo.

Bức tường xuyên biên giới đó, hoàn toàn không thể vượt qua—những phòng máy bỏ hoang hoặc bán phần không hoạt động ở Tây Bắc, không phải là không thể xây, mà là xây xong rồi mới phát hiện: Tường còn cao hơn cả các nhà máy điện.

Một bên là Silicon Valley tối đa hóa token, một bên là trung tâm dữ liệu Tây Bắc bỏ không. Điện rẻ nhất Trung Quốc đã tạo ra AI Token rẻ nhất thế giới. Nhưng các doanh nghiệp AI Trung Quốc, cuối cùng có thể thu về bao nhiêu giá trị từ đó?

1. Cách đây mười năm, cùng một nhà máy điện đã đón một nhóm khách khác

Năm 2015, các nhà quản lý nhà máy điện ở Tứ Xuyên, Vân Nam và Tân Cương bắt đầu tiếp đón một nhóm khách lạ. Họ thuê nhà xưởng bỏ hoang, lắp đầy máy móc dày đặc, hoạt động 24/24. Máy không sản xuất gì, chỉ liên tục làm một phép tính toán học. Thỉnh thoảng, từ vô tận các phép tính, xuất hiện một Bitcoin.

Đó là phiên bản 1.0 của giá trị điện năng ra biển. Nước điện giá rẻ qua các máy đào hash đổi lấy tài sản số lưu thông toàn cầu, rồi trên sàn giao dịch quy đổi thành đô la Mỹ. Điện không vượt qua biên giới nào, nhưng giá trị của nó, dưới dạng Bitcoin, chảy ra toàn cầu. Thời kỳ đỉnh cao, Trung Quốc chiếm hơn 70% sức mạnh khai thác Bitcoin toàn cầu.

Con đường thu lợi từ Bitcoin cực kỳ ngắn—điện biến thành tính toán, tính toán thành BTC, BTC thành đô la. Không phụ thuộc ai. Bitcoin là sản phẩm cuối cùng, một loại vàng kỹ thuật số được chứng thực bằng năng lượng, có thể quy đổi thành tiền mặt ngay tại mỏ. Nó có thể ra biển trần truồng.

Nhưng con đường ngắn đồng nghĩa với nền móng yếu.

Năm 2021, quy định chặt chẽ, các thợ mỏ phân tán, giá trị thu về lập tức về 0. Sức mạnh tính toán di chuyển sang Kazakhstan, Texas, Canada. Các nhà máy điện vẫn phát điện như cũ, chỉ là điện đó không còn thể biến thành đô la nữa.

Logic của điện năng không biến mất, nó chỉ đang chờ một lớp vỏ mới.

Sau khi ChatGPT xuất hiện, cùng một nhóm nhà máy điện, cùng một nhà xưởng, thậm chí cùng hợp đồng điện, bỗng chốc biến thành trung tâm dữ liệu AI. Máy đào đổi thành GPU, Bitcoin đổi thành AI Token.

Nhưng AI Token không phải Bitcoin.

Bitcoin là sản phẩm cuối cùng, AI Token là bán thành phẩm. AI Token phải qua nhiều lớp mô hình, sản phẩm, quy trình làm việc để trở thành thứ khách hàng sẵn sàng trả tiền. Nó không thể ra biển trần trụi. Chuỗi ngành xây dựng quanh bán thành phẩm này phức tạp hơn nhiều—từ nguồn điện xanh và phòng máy làm mát bằng dung dịch, đến chip AI, máy chủ, rồi API mô hình lớn, nền tảng tổng hợp, và tuân thủ xuyên biên giới, nối liền bảy tầng.

Chuỗi giá trị dài ra. Mỗi tầng đều có người chen chân.

Chỉ có điện năng và một câu hỏi không đổi: lần này, giá trị còn lại được bao nhiêu?

2. Hành trình của một kWh điện, và cây cầu đứt đoạn của nó

Để trả lời câu hỏi này, hãy theo dõi một kWh điện.

Mỗi lần Arjun nhấn Enter, có năm bước nối tiếp: Điện năng → Tính toán → Huấn luyện mô hình → Suy luận mô hình → Giao AI Token đến màn hình của anh.

Ba bước đầu đã xong từ lâu. Một kWh điện từ nhà máy thủy điện Tứ Xuyên, chảy đến trung tâm dữ liệu Nội Mông, vận hành cụm GPU hàng tháng, nuôi hàng nghìn tỷ dữ liệu, huấn luyện một mô hình lớn. Sau khi xong, “công thức” của mô hình đã định hình. Ưu thế về điện của Trung Quốc được mã hóa hoàn chỉnh ở bước này—chi phí huấn luyện thấp hơn, kiến trúc hiệu quả hơn, tối ưu kỹ thuật do hơn chục công ty cạnh tranh nhau. Năng lượng của một kWh được nén vào một tệp vài trăm GB.

Hai bước còn lại là đang diễn ra ngay lúc này. Mỗi lần Arjun nhấn Enter, một trung tâm dữ liệu sẽ bắt đầu suy luận: tải công thức, tiêu thụ tính toán và điện năng, tại chỗ tạo ra một loạt AI Token, gửi về kết quả. Mỗi AI Token sinh ra đều cần điện năng theo thời gian thực.

Vấn đề là: trung tâm dữ liệu nào?

2.1 Hai con đường hoàn toàn khác nhau của AI Token ra biển

Arjun hiện theo con đường thứ nhất—suy luận hoàn tất tại Trung Quốc, AI Token được giao qua API xuyên biên giới. Yêu cầu vượt Thái Bình Dương đến Quý Châu, rồi gửi về San Francisco. Điện xanh nội địa 0.38 nhân dân tệ/kWh, trực tiếp giảm chi phí biên của mỗi AI Token. Lợi ích của Arjun thực chất là điện nước của Trung Quốc đang trả tiền, lợi thế về điện năng được thể hiện rõ ràng.

Con đường thứ hai—đưa công thức ra nước ngoài, làm suy luận tại Virginia hoặc Singapore. Các nền tảng như Microsoft Azure của Zhipu, DeepSeek, MiniMax qua Amazon AWS, đều theo con đường này. Suy luận dùng điện và GPU địa phương, chi phí mỗi AI Token không khác gì điện giá Trung Quốc.

2.2 Coca-Cola chưa bao giờ xuất khẩu chai nước

Mô hình thứ hai giống như Coca-Cola—không vận chuyển chai nước từ nhà máy Mỹ đi khắp thế giới, mà là xuất khẩu công thức, rồi dùng nước và dây chuyền đóng gói địa phương.

Mở nền tảng Alibaba Cloud Bailing, có menu chọn phạm vi triển khai dịch vụ—“Trong nội địa Trung Quốc”, “Quốc tế”, “Toàn cầu”. Chọn “Quốc tế”, suy luận chạy tại Virginia, quy định biến mất, giá điện cũng thành của Mỹ. Chính cái menu này chính là công tắc chuyển từ mô hình thứ nhất sang thứ hai.

Nhưng Coca-Cola dựa vào công thức để bán toàn cầu, vì không ai có thể sao chép. Mô hình lớn khác—DeepSeek, Tongyi Qianwen là mã nguồn mở, ai cũng có thể tải trọng số về. Công thức mở, dây chuyền đóng gói là của người khác, điện cũng của người khác. Điểm neo giữ giá trị chỉ còn một: tốc độ ra công thức.

Báo cáo của Ngân hàng Công nghiệp Thượng Hải nói rằng, chu kỳ cập nhật mô hình lớn toàn cầu đã rút ngắn từ nửa năm xuống còn vài tháng. Nếu bị chậm lại do lệnh cấm chip, thì “cửa sổ tươi mới” sẽ càng ngày càng ngắn.

Arjun không quan tâm công thức đến từ quốc gia nào. Anh chỉ quan tâm tuần này rẻ nhất, tuần sau có còn dùng được không.

Hành trình ra biển của một kWh điện đã bị đứt giữa huấn luyện và suy luận. Không chỉ đứt chuỗi chi phí, mà còn đứt luôn chuỗi giá trị.

Mô hình thứ nhất giữ vững lợi thế về điện, nhưng mất thị trường—khách hàng doanh nghiệp không chấp nhận dữ liệu đi qua Trung Quốc, độ trễ là điểm yếu cố hữu. Mô hình thứ hai mở ra thị trường, nhưng mất chi phí—bạn không còn bán điện rẻ nữa, mà là bán công thức.

Thời gian cũng không đứng về phía Trung Quốc. Deloitte dự đoán, trung tâm sức mạnh AI toàn cầu đang chuyển từ huấn luyện sang suy luận—tỷ lệ suy luận sẽ từ một phần ba năm 2023 lên hai phần ba, có thể vượt quá tám phần mười trong tương lai. Huấn luyện chỉ mất một lần, còn suy luận là hoá đơn hàng ngày. Càng suy luận quan trọng, phần do giá điện quyết định càng nhỏ.

Đây chính là sự khác biệt cốt lõi giữa xuất khẩu AI Token và xuất khẩu năng lượng mặt trời. Năng lượng mặt trời từ silic nguyên liệu đến thành phẩm, đến lắp đặt, chi phí lợi thế truyền dẫn suốt quá trình, không có điểm đứt. Chi phí của AI Token bị chia rẽ giữa huấn luyện và suy luận—nếu không thể vượt qua lợi thế về điện, thì phần truyền dẫn xuyên biên giới thực sự nằm trong năng lực kỹ thuật được mã hoá trong công thức vài trăm GB đó.

Hai mô hình, hai khó khăn. Dựa vào điện rẻ để bán AI Token ra biển, con đường này đi được bao xa?

3. Điện rẻ, không qua được tường

Không xa. Ba bức tường đang thu hẹp con đường này lại.

Bức tường thứ nhất là vật lý.

Yêu cầu của Arjun vượt Thái Bình Dương, vòng quanh 150 đến 300 mili giây. Một cuộc đối thoại không cảm nhận rõ. Nhưng quy trình Agent là hàng chục vòng gọi liên tiếp, máy không chờ đợi, độ trễ tích tụ thành giây, quy trình bị kẹt. Không phải vấn đề chính trị, không phải vấn đề thể chế, mà là tốc độ ánh sáng quyết định.

Hoặc đứng trong ánh sáng, hoặc ánh sáng đứng đó.

Bức tường thứ hai là thể chế.

Các doanh nghiệp Mỹ mua dịch vụ AI, người phụ trách kỹ thuật phải trả lời năm câu hỏi: dữ liệu có truyền vào Trung Quốc không? Nhật ký ở đâu? Dữ liệu đầu vào, đầu ra có dùng để huấn luyện không? Có phù hợp pháp luật địa phương không? Ai chịu trách nhiệm nếu có vấn đề?

Không trả lời được năm câu hỏi đó, quy trình mua hàng dừng lại. Không phải do mô hình không tốt, mà do bộ phận pháp lý không ký.

Giám đốc kinh tế trưởng của Morgan Stanley, Xing Ziqiang, từng đề cập một ví dụ sắc nét hơn: Huawei cũng có lợi thế về công nghệ và giá cả trong thiết bị 5G, nhưng sau năm 2018, vẫn bị loại khỏi mạng viễn thông Mỹ và châu Âu. Các trạm 5G và AI Token đều liên quan đến luồng dữ liệu đi qua thiết bị của ai, lưu trữ trên máy chủ của ai. Ông nói:

“Đừng quá ca ngợi lợi thế về điện của AI Token ra biển, mà bỏ qua các yếu tố địa chính trị và an ninh.”

Lợi thế công nghệ không thể cứu vãn niềm tin sụt giảm.

Bức tường thứ ba là chính trị.

Lệnh cấm chip gây khó trong huấn luyện, kiểm duyệt mô hình gây khó trong đưa lên nền tảng. Những biến số khó đoán nhất.

Ba bức tường này giới hạn phạm vi rất hẹp: dựa vào điện rẻ để bán AI Token ra biển, chỉ còn những nhà phát triển không quá nhạy cảm với quy định, có thể chịu đựng độ trễ, và cực kỳ nhạy cảm với giá cả. Con đường ra công thức, lợi thế về điện năng không thể truyền dẫn.

Hai mô hình, hai điểm chết. Các doanh nghiệp AI Trung Quốc trên chuỗi giá trị toàn cầu, cuối cùng đứng ở vị trí nào?

4. Nhà vô địch nhỏ trên sân nhỏ, khán giả trên chuỗi giá trị

Ngày 24 tháng 2 năm 2026, dữ liệu của OpenRouter công bố: top 10 mô hình tổng cộng tiêu thụ AI Token là 8.7 nghìn tỷ, trong đó mô hình Trung Quốc chiếm 5.3 nghìn tỷ, tỷ lệ 61%.

“Trung Quốc lần đầu vượt Mỹ”—tin tức lan truyền khắp internet tiếng Trung.

Giám đốc vận hành của OpenRouter, Chris Clark, mô tả trong podcast: “Mô hình mã nguồn mở của Trung Quốc chiếm tỷ lệ cực cao trong quy trình Agent của các doanh nghiệp Mỹ.” Một nhiệm vụ mã phức tạp, dùng Claude tốn 50 đến 100 đô, dùng DeepSeek V3.2 chỉ khoảng 0.5 đô. Khoảng cách giá gấp trăm lần, đối với các startup chạy hàng chục Agent, đó là giới hạn sinh tử.

Nhưng đằng sau 61%, ẩn chứa hai sự thật.

Thứ nhất: đây chỉ là sân nhỏ.

Chỉ có khoảng 3% tiêu thụ AI Token của toàn cầu được OpenRouter thống kê. Sân lớn hơn, tỷ số còn chênh lệch nhiều.

Tháng 4 năm 2026, Anthropic đạt doanh thu hàng năm vượt 30 tỷ đô. Cách đó 15 tháng, con số này mới là 1 tỷ—tăng gấp 30 lần. Công cụ mã hóa Claude Code mới ra mắt nửa năm đã đạt 1 tỷ đô. Hàng nghìn doanh nghiệp trả phí hàng năm trên 1 triệu đô, 80% doanh thu từ khách hàng doanh nghiệp. OpenAI đạt 25 tỷ đô doanh thu hàng năm.

Phía Trung Quốc: MiniMax tiêu thụ 5 tỷ đô trong chín tháng, doanh thu 79 triệu đô. Tạp chí Caijing còn tàn nhẫn hơn—một số API của các mô hình Trung Quốc có thể lỗ, mỗi lần xử lý yêu cầu đều lỗ.

Trung Quốc sản xuất nhiều nhất AI Token, nhưng gần như vô hình trong chuỗi giá trị.

Thứ hai: không phải AI Token nào cũng có giá trị như nhau.

Cùng một AI Token, giá trị trò chuyện phiêu lưu là 0.01 đô/triệu, viết mã là 200 đô/triệu, xem xét pháp lý là 1000 đô/triệu. Chênh lệch hàng chục nghìn lần. Các ngành ước tính, chưa đến 5% tiêu thụ tạo ra hơn 80% giá trị thương mại.

Chỉ trong tuần viết bài này, Anthropic và Blackstone, Goldman Sachs thành lập liên doanh 15 tỷ đô, đưa kỹ sư trực tiếp vào các doanh nghiệp trong danh mục PE. Đồng thời ra 10 Agent tài chính—tạo pitchbook, KYC, biên bản tín dụng, kết toán cuối tháng, kiểm toán tài chính. Jamie Dimon và Dario Amodei cùng xuất hiện. Một Agent KYC tiêu thụ vài chục đô AI Token mỗi lần, tiết kiệm hàng nghìn đô nhân lực phù hợp quy định.

Đây chính là bức tranh thực của AI Token giá trị cao.

Marc Nachmann của Goldman Sachs nói: “Chỉ có mô hình không đủ để thay đổi quy trình làm việc của bạn. Bạn cần người có thể kết hợp công nghệ và kinh doanh thực tế.”

Câu này chính xác cắt đứt khoảng cách giá trị giữa Trung Quốc và Mỹ. Các công ty Trung Quốc cạnh tranh về giá AI Token, còn Anthropic cạnh tranh về cách tích hợp AI Token vào từng dòng công việc của Goldman. Người Trung Quốc bán nguyên liệu, còn người Mỹ bán giải pháp. Các mô hình Trung Quốc trong toolbox của nhà phát triển toàn cầu không phải là kiến trúc sư chính, mà là công nhân theo hợp đồng.

Điều này rất giống câu chuyện của ngành năng lượng mặt trời Trung Quốc năm 2008—chiếm lĩnh toàn cầu về xuất khẩu, nhưng phần lợi nhuận mỏng nhất là các linh kiện. Quyền định giá, giá trị thương hiệu, thị phần cao cấp đều nằm trong tay người khác. Năm đó còn hơn mười năm nữa Trung Quốc mới thực sự thống trị toàn cầu ngành này.

Nhưng câu chuyện năng lượng mặt trời 2008 không dừng lại ở “có lượng mà không có lợi”. Cuối cùng, doanh nghiệp Trung Quốc chiến thắng toàn cầu không phải nhờ silic rẻ, mà là kiểm soát toàn bộ chuỗi từ silic nguyên liệu đến linh kiện, đến nhà máy điện.

Hy vọng xuất khẩu AI Token không nằm ở giá điện—mà ở khả năng biến từ “nhà sản xuất rẻ nhất” thành hạ tầng tích hợp trong quy trình doanh nghiệp.

Đã có người thử.

Công ty Xunce đang dùng AI Token trong các lĩnh vực tài chính, năng lượng, để tính phí dựa trên dữ liệu và quy trình kinh doanh. Phần trăm phí từ AI Token từ 5% tăng lên 20-30%, dự kiến lợi nhuận lần đầu trong nửa cuối 2025. Họ không bán AI Token rẻ, mà là “dùng AI Token để chạy lại quy trình của bạn”. Cách làm này giống hệt Anthropic đưa AI vào Goldman—chỉ là trong ngành dọc Trung Quốc mới bắt đầu, còn một bên đã có 15 tỷ đô và Jamie Dimon.

Khoảng cách rất lớn, nhưng hướng đi đúng.

5. Điện không đổi, hóa đơn thay đổi

Tháng 5 năm 2026, Doubao ra phiên bản trả phí, 68 tệ/tháng. 3.45 tỷ người dùng hoạt động hàng tháng bắt đầu trả phí.

Cùng tuần, Tencent Cloud AI tăng giá 5%, Zhipu GLM-5 tăng 50% so với thế hệ trước.

Có người đã phân tích chi phí suy luận của Doubao—chi phí phần cứng 58%, điện 29%. Mỗi người dùng thêm là thêm một phần tiêu thụ trên cụm GPU. Nội bộ ByteDance đã có ý kiến: “Chưa thấy rõ lộ trình thương mại, chi phí suy luận của DAU lớn gây áp lực lợi nhuận.”

Những ngày các công ty lỗ để quảng bá đã kết thúc.

Việc tăng giá đã phản ánh một vấn đề nền tảng hơn ba bức tường: lợi thế về điện làm giảm chi phí sản xuất AI Token, nhưng giá trị của AI Token không bao giờ phụ thuộc vào chi phí sản xuất, mà phụ thuộc vào mục đích sử dụng của nó. Một kWh điện tạo ra AI Token, dùng để trò chuyện hay ra quyết định doanh nghiệp, giá trị chênh nhau hàng chục vạn lần.

Trung Quốc có điện rẻ nhất thế giới, huấn luyện ra AI Token rẻ nhất thế giới, chiếm 61% trên OpenRouter, nhưng doanh thu hàng năm của Anthropic có thể vượt tất cả các công ty mô hình lớn Trung Quốc cộng lại.

Các nhà máy điện và trung tâm dữ liệu ở Quý Châu vẫn đang chuyển đổi. Mười năm trước, cùng nguồn điện đó nuôi mỏ đào, rồi bị dẹp bỏ. Nay cùng nguồn điện đó nuôi nhà máy sản xuất AI Token. Nhà máy vẫn còn, chỉ là lượng AI Token ngày càng nhiều, giá trị còn lại ngày càng ít.

Arjun tối nay lại tiếc rẻ vài chục đô. Nhưng mỗi đô anh tiết kiệm chính là phần giá trị mà các doanh nghiệp AI Trung Quốc chưa thể thu về.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim