Từ cơ sở hạ tầng điện lực đến kinh tế Token: "Bánh kem bảy lớp" của chuỗi ngành công nghiệp AI

Tiêu đề gốc: Từ Cơ sở hạ tầng điện lực đến Token Economy: "Bánh kem bảy lớp" của chuỗi ngành AI

Tác giả gốc: Lục Động BlockBeats

Nguồn gốc gốc:

Chuyển thể: Mars Finance

Động lực của thời đại AI đã chuyển từ mô hình sang Token

Trong hai năm qua, logic kể chuyện của nửa đầu ngành AI chủ yếu xoay quanh "Chiến tranh mô hình lớn" do các công ty lớn khởi xướng. Số lượng tham số từ trăm tỷ tiến tới nghìn tỷ, chi phí huấn luyện từ vài chục triệu USD tăng lên hàng trăm triệu USD, cụm GPU từ vài nghìn card mở rộng thành hàng chục nghìn card. Mọi người đều tranh luận về mô hình nào mạnh hơn, ai gần hơn với AGI, như thể điểm cuối của cuộc đua AI là hiệu năng của chính mô hình lớn.

Nhưng đến năm 2026, logic thúc đẩy ngành AI đã thay đổi. Báo cáo mới nhất của JPMorgan cho rằng, tương lai, động lực thực sự để mở rộng hạ tầng AI không còn là huấn luyện mô hình nữa, mà là nhu cầu suy luận AI (Inference) khổng lồ. Trong tương lai, tiêu thụ nhiều sức mạnh tính toán nhất không còn chỉ là huấn luyện mô hình lớn, mà là các AI Agent trên toàn cầu. Mỗi lần gọi, mỗi lần tương tác, mỗi nhiệm vụ thực thi đều về cơ bản tiêu hao Token. Ngành công nghiệp AI đang bước vào "Thời đại Token" thay vì "Thời đại mô hình".

Bởi vì, điều thực sự thúc đẩy hoạt động của thế giới AI trong tương lai không chỉ là mô hình, mà còn là hệ thống sản xuất, phân phối, điều phối và tiêu thụ dựa trên Token. Đặc biệt khi AI Agent bắt đầu xuất hiện quy mô lớn, cách Token được tạo ra theo thời gian thực, phân phối xuyên khu vực, điều phối động và tiêu thụ hiệu quả sẽ trở thành vấn đề cốt lõi mới của toàn ngành AI.

Như lời của Huang Renxun gần đây đã đề xuất, AI không chỉ là một ngành phần mềm đơn thuần, mà còn là một hệ thống hạ tầng cơ bản như điện lực và internet. Trong kiến trúc "bánh kem năm lớp" của ông, ngành AI được phân thành năm tầng: Năng lượng, Chip, Cơ sở hạ tầng, Mô hình và Ứng dụng. Và khi ngành AI từ "Thời kỳ huấn luyện" dần bước vào "Thời kỳ suy luận", GoodVision AI thích nghi hơn khi xem toàn bộ chuỗi ngành kinh tế AI như một "bánh kem bảy lớp" xoay quanh Token:

Lớp 1: Điện lực — Nền tảng năng lượng của thời đại AI Lớp 2: AIDC — Nhà máy Token Lớp 3: GPU — Thiết bị sản xuất Token Lớp 4: LLM — Động cơ sản xuất Token Lớp 5: Phân phối Token — "Lưới điện" của thời đại AI Lớp 6: Tối ưu hóa Token và Điều phối thông minh — Bộ não của thời đại AI Lớp 7: AI Agent — Thiết bị tiêu thụ Token

Từ năng lượng, GPU, đến AIDC, các nút biên, rồi đến suy luận mô hình và điều phối thông minh, ngành AI đang hình thành một hệ thống "ngành công nghiệp Token" chưa từng có.

Tuy nhiên, ở giai đoạn hiện tại, hệ thống này vẫn còn rất non trẻ.

Có người sở hữu GPU tiên tiến nhất nhưng bị hạn chế bởi năng lượng; có người xây dựng AIDC khổng lồ nhưng thiếu điều phối hiệu quả; có người phát triển AI Agent mạnh mẽ nhưng đối mặt chi phí suy luận cao và độ trễ lớn; có người nắm giữ các nút biên nhưng không thể hình thành mạng lưới hợp tác thống nhất. Chuỗi ngành công nghiệp dù đang phát triển nhanh, nhưng các tầng vẫn còn tồn tại nhiều phân mảnh, dư thừa và điểm nghẽn về hiệu quả.

Chỉ khi bảy tầng hạ tầng này thực sự được kết nối, hợp tác và phối hợp chặt chẽ, ngành AI mới có thể từ "Thời đại công cụ" bước vào "Thời đại ứng dụng quy mô lớn của thế giới thông minh".

Lớp bánh kem thứ nhất: Điện lực — Nền tảng năng lượng của thời đại AI

Cuộc cách mạng công nghiệp tranh giành than đá và dầu mỏ, thời đại internet tranh giành lưu lượng và máy chủ, còn trong thời đại AI, cuộc chiến ở tầng thấp nhất đang trở lại với năng lượng.

Bởi vì AI cuối cùng tiêu thụ năng lượng là điện. Một trung tâm dữ liệu AI lớn tiêu thụ gần như một thành phố trung bình. Các trung tâm dữ liệu AI mới xây dựng trên toàn cầu đang đối mặt cùng một vấn đề: GPU có thể mua, đất đai có thể xây, nhưng cung cấp điện không đủ, hệ thống phân phối điện cũng không theo kịp.

Đây cũng là lý do tại sao ngày càng nhiều công ty AI bắt đầu chú ý lại đến hạ tầng năng lượng. Tại GTC 2026, Huang Renxun thậm chí định nghĩa trung tâm dữ liệu trong tương lai là "Nhà máy Token". Nhà máy này sẽ sinh ra một ngành năng lượng siêu lớn.

Ở thị trường Trung Quốc, các công ty như Yangtze Power, China Nuclear Power, China General Nuclear, Three Gorges Energy, Longyuan Power, Huadian New Energy lần lượt đại diện cho các lĩnh vực năng lượng chính như thủy điện, hạt nhân, gió và quang điện. Trong đó, năng lượng hạt nhân và thủy điện nhờ khả năng cung cấp ổn định đang trở thành nguồn năng lượng nền tảng quan trọng nhất cho AIDC; còn năng lượng gió và quang điện hưởng lợi từ nhu cầu về điện xanh và ESG của ngành AI. Với sự thúc đẩy của "Dông số Tây tính" và xây dựng trung tâm dữ liệu AI quy mô lớn, mối quan hệ hợp tác giữa các cơ sở năng lượng mới và trung tâm tính toán đang nhanh chóng tăng cường.

Ở thị trường Mỹ, các tập đoàn năng lượng truyền thống như NextEra Energy, Dominion Energy, Duke Energy, Southern Co., Exelon cũng đang hưởng lợi từ mở rộng trung tâm dữ liệu AI. Trong đó, NextEra là nhà cung cấp điện xanh hàng đầu Bắc Mỹ; Dominion kiểm soát nguồn truyền tải chính của "Dãy trung tâm dữ liệu" Bắc Virginia; Exelon nhờ khả năng cung cấp điện ổn định từ năng lượng hạt nhân, trở thành người hưởng lợi chính của nhu cầu "điện năng cao ổn định 24/7" trong thời đại AI. Nhìn chung, ngành điện toàn cầu đang dần chuyển mình từ dịch vụ công truyền thống thành lớp tài nguyên cốt lõi của hạ tầng AI.

Tổng thể, tầng này đang chuyển từ "cạnh tranh giá điện" của các công ty năng lượng truyền thống sang "cuộc chiến giành quyền kiểm soát điện" giữa các trung tâm dữ liệu AI, nhà cung cấp đám mây và các công ty năng lượng. Ai có thể giữ vững nguồn năng lượng dài hạn, ổn định, chi phí thấp, người đó nắm giữ viên ngọc rồng đầu tiên của Token.

Lớp bánh kem thứ hai: AIDC — Nhà máy nguyên liệu Token

Một GPU đơn lẻ không có ý nghĩa, điều quan trọng là quy mô tập trung. Vì vậy, xuất hiện AIDC.

Nó giống như các nhà máy luyện thép, nhà máy điện và dây chuyền sản xuất trong thời đại công nghiệp, tập trung hàng nghìn GPU để tạo ra khả năng sản xuất Token ổn định. Nhưng vấn đề của nhà máy cũng bắt đầu xuất hiện: xây dựng AIDC truyền thống thường mất từ 18 đến 36 tháng, mở rộng lưới điện còn lâu hơn nữa. Khi nhu cầu AI tăng theo cấp số nhân, tốc độ xây dựng IDC cũ đã không còn đáp ứng được nền kinh tế Token mới.

Trong thị trường Mỹ, Equinix là một trong những nhà vận hành trung tâm dữ liệu hàng đầu thế giới, có hơn 240 trung tâm dữ liệu tại hơn 30 quốc gia. Ưu thế cốt lõi của họ không chỉ là số lượng phòng máy, mà còn là khả năng kết nối toàn cầu và mạng lưới độ trễ thấp, trở thành các nút hạ tầng quan trọng để triển khai sức mạnh tính toán AI.

Digital Realty thông qua nền tảng PlatformDIGITAL tiếp cận hạ tầng AI, phục vụ các nhà cung cấp đám mây lớn và các tổ chức tài chính.

Ở thị trường Trung Quốc, Runze Technology là một trong những nhà vận hành AIDC tiêu biểu nhất của cổ phiếu A. Kinh doanh chính của họ đã dần chuyển từ IDC truyền thống sang trung tâm tính toán AI, thế mạnh nằm ở quy mô phòng máy lớn, nguồn điện và khả năng vận hành AIDC. Các doanh nghiệp như AoFei Data, Capital Online cũng liên tục mở rộng trong các lĩnh vực trung tâm dữ liệu khu vực, hạ tầng đám mây và dịch vụ lưu trữ tính toán AI. Trung Quốc Thư Quang (Sugon) tập trung hợp tác trong lĩnh vực AIDC với các cơ quan chính phủ và nghiên cứu.

Một nhóm khác đến từ "chuyển đổi mỏ đào". CoreWeave, IREN, Applied Digital, Cipher Mining, v.v., ban đầu chủ yếu liên quan đến khai thác tiền mã hóa, nhưng khi nhu cầu GPU AI tăng vọt, họ nhanh chóng chuyển hướng sang hạ tầng tính toán AI. IREN theo mô hình "điện sạch + tính toán AI", xây dựng trung tâm dữ liệu GPU mật độ cao dựa trên năng lượng tái tạo. Applied Digital và Cipher Mining cũng đang chuyển đổi từ mỏ đào truyền thống sang hạ tầng tính toán hiệu năng cao AI.

Ngoài ra, xu hướng mới nổi là các nhà máy AI nhỏ, mô-đun, nhẹ. Giống như thời đại internet chuyển từ máy chủ lớn sang điện toán đám mây, năng lực tính toán AI cũng đang dần lan tỏa từ các trung tâm quy mô lớn đến các nút biên khu vực.

Vì vậy, GoodVision AI chọn con đường khác: xây dựng các nhà máy AI nhẹ, mô-đun, có thể nhân rộng nhanh chóng. So với AIDC truyền thống, GoodVision AI nhấn mạnh khả năng triển khai khu vực, hiệu quả của các cụm GPU mật độ cao, và sự phối hợp tích hợp giữa năng lượng và tính toán.

Chủ trương của họ không phải xây dựng trung tâm dữ liệu siêu lớn đơn lẻ, mà là triển khai nhanh các nút nhà máy AI nhỏ, thường là các phòng máy suy luận 2-4MW tại các khu vực dân cư đông đúc toàn cầu. Mô hình này không chỉ dễ dàng tiếp cận nguồn năng lượng địa phương hơn, mà còn phù hợp hơn với xu hướng mở rộng nhu cầu suy luận AI về phía biên.

Nếu nói AIDC truyền thống giống như các nhà máy luyện thép lớn của thời kỳ công nghiệp, thì GoodVision AI xây dựng chính là "nhà máy Token khu vực" của thời đại AI — nhẹ hơn, linh hoạt hơn, gần gũi hơn với người dùng, và phù hợp hơn với xu hướng mạng lưới suy luận phân tán toàn cầu trong tương lai.

Lớp bánh kem thứ ba: GPU — Thiết bị sản xuất Token

Nếu điện lực là năng lượng, thì GPU chính là thiết bị sản xuất. Trong những năm đầu bùng nổ AI, GPU chủ yếu phục vụ huấn luyện; nhưng trong tương lai, nhu cầu lớn hơn sẽ đến từ suy luận. Bởi vì huấn luyện chỉ dành cho một số ít công ty hàng đầu, còn suy luận sẽ thấm vào từng ứng dụng, từng thiết bị, từng thiết bị cuối cùng. Robot cần suy luận, tự lái cần suy luận, kính AI cần suy luận, thậm chí trong tương lai, sự hợp tác giữa các AI Agent cũng đều tiêu hao Token theo thời gian thực.

NVIDIA vẫn là trung tâm tuyệt đối của ngành chip AI toàn cầu. Các sản phẩm GPU như H100, B200, Blackwell gần như định nghĩa tiêu chuẩn suy luận và huấn luyện AI toàn cầu hiện nay. Quan trọng hơn, NVIDIA không chỉ bán chip, mà còn xây dựng hệ sinh thái hoàn chỉnh qua CUDA, TensorRT, DGX, HGX, khiến đối thủ cạnh tranh không chỉ cần thách thức hiệu năng GPU, mà còn phải cạnh tranh toàn bộ hệ sinh thái phần mềm AI.

AMD là đối thủ chính hiện nay, với các sản phẩm chủ lực như MI300X và các GPU AI khác. So với NVIDIA, AMD nhấn mạnh hơn vào hệ sinh thái mở và nền tảng phần mềm ROCm, mong muốn thu hút các nhà phát triển AI và khách hàng doanh nghiệp bằng cách mở rộng hơn.

Broadcom và Marvell đại diện cho hướng đi khác — ASIC và liên kết tốc độ cao. Khi các kịch bản suy luận AI ngày càng phức tạp, nhiều doanh nghiệp bắt đầu tùy biến chip ASIC để đạt hiệu quả năng lượng cao hơn và chi phí thấp hơn.

Intel tham gia thị trường AI qua CPU máy chủ và thẻ tăng tốc Gaudi, hy vọng dùng hệ sinh thái CPU của mình để tái tham gia cuộc đua hạ tầng AI.

Ở thị trường Trung Quốc, Cambricon là một trong những doanh nghiệp tiêu biểu về chip AI nội địa, chủ yếu phát triển dòng chip SiYuan và xây dựng khung phần mềm AI tự phát triển Neuware. Hygon Information sở hữu giấy phép kiến trúc AMD Zen, tập trung vào thị trường DCU và suy luận AI.

Các công ty nội địa như Moore Threads, Biren Technology, Muoxi Co., Ltd., Biren Technology, v.v., đại diện cho hướng "thay thế nội địa" trong ngành chip AI Trung Quốc. Họ đều nhấn mạnh khả năng tương thích với hệ sinh thái CUDA và cố gắng xây dựng cụm GPU nội địa.

Từ hệ sinh thái CUDA đến bộ nhớ HBM, rồi đến Tensor Core, toàn bộ ngành công nghiệp AI thực chất là liên tục nâng cao "hiệu suất tạo Token trên đơn vị thời gian". Đồng thời, GPU cùng các hạ tầng nền tảng như máy chủ, module quang, làm mát bằng chất lỏng, switch, v.v., cũng liên quan mật thiết đến hiệu quả sản xuất Token.

Những thứ này không rực rỡ như NVIDIA, OpenAI, hay các công ty ứng dụng AI, nhưng quyết định liệu thế giới AI có thể vận hành thực sự hay không. Giống như cuộc cách mạng công nghiệp không chỉ cần máy hơi nước, mà còn cần đường sắt, lưới điện và cảng biển. Cuộc cách mạng AI cũng không chỉ là một cuộc cách mạng phần mềm. Nó là một cuộc nâng cấp toàn bộ chuỗi ngành công nghiệp toàn cầu về năng lượng, chip, mạng, điện toán đám mây và hạ tầng.

Vertiv là nhà cung cấp hàng đầu thế giới về UPS và quản lý điện năng cho trung tâm dữ liệu, cung cấp hệ thống cấp điện, phân phối tủ rack và hệ thống điều hòa chính xác.

Inspur là nhà dẫn đầu về hệ thống làm mát bằng chất lỏng và điều khiển nhiệt độ trong cổ phiếu A, khách hàng bao gồm các tập đoàn lớn như BAT. Khi công suất GPU ngày càng cao, làm mát bằng chất lỏng đang trở thành tiêu chuẩn quan trọng của AIDC.

China Huaneng, KEHUA Data, KSTAR, v.v., giữ vị trí quan trọng trong lĩnh vực UPS, hệ thống nguồn và cấp điện cho IDC.

Trong lĩnh vực mạng và module quang, các công ty như ZTE, Innolux, Tenda Communications, v.v., hưởng lợi từ sự bùng nổ nhu cầu truyền thông tốc độ cao trong nội bộ các cụm AI.

Trong lĩnh vực lắp ráp máy chủ, các công ty như Dell, HPE, Supermicro, Lenovo, Inspur, v.v., đảm nhận việc lắp ráp và giao hàng quy mô lớn các máy chủ AI.

Dù tầng này không trực tiếp tiếp xúc với người dùng cuối, nhưng quyết định liệu hạ tầng AI có thể vận hành ổn định hay không. Làm mát bằng chất lỏng, UPS, module quang, switch, lưu trữ năng lượng và lắp ráp máy chủ, giống như đường sắt, lưới điện và cảng biển của thời kỳ công nghiệp, đang trở thành "ngành kinh doanh bán chổi" thực sự của thế giới AI.

Lớp bánh kem thứ tư: LLM — Động cơ sản xuất Token

LLM (Mô hình ngôn ngữ lớn) quyết định cách Token được hiểu, sinh ra và tổ chức như thế nào. Trong hai năm qua, các công ty như OpenAI, Anthropic, Google, Meta, xAI, DeepSeek đã khơi mào cuộc đua "mô hình lớn" toàn cầu. Số lượng tham số từ trăm tỷ tiến tới nghìn tỷ, khả năng của mô hình cũng mở rộng từ sinh văn bản sang đa phương thức, suy luận, mã, hợp tác Agent và ghi nhớ dài hạn.

Nhưng khi ngành phát triển dần, thị trường cũng nhận ra: điều thực sự quan trọng trong tương lai không còn là "ai sở hữu mô hình lớn nhất", mà là ai có thể duy trì vận hành mô hình với chi phí thấp hơn, hiệu quả cao hơn. Bởi vì mô hình bản thân không trực tiếp tạo ra giá trị, giá trị thực sự đến từ quá trình suy luận sau mỗi lần gọi mô hình.

Điều này cũng có nghĩa là, LLM đang từ "trưng bày khả năng của mô hình" dần tiến tới "động cơ sản xuất Token" trong thế giới AI.

Các mô hình như OpenAI, Anthropic, Google Gemini, Meta Llama, v.v., đang cạnh tranh để chiếm lĩnh cổng vào hệ sinh thái AI tương lai; trong khi các đối thủ mới như DeepSeek, bằng cách tối ưu chi phí và hiệu quả suy luận, bắt đầu định hình lại cục diện cạnh tranh ngành. Hiện tại, cạnh tranh ở tầng LLM không còn chỉ dựa vào tham số nữa, mà chuyển sang các tiêu chí đa chiều:

Chi phí Token Hiệu quả suy luận Khả năng Context Hợp tác nhiều Agent Ghi nhớ dài hạn Khả năng phối hợp mô hình và hạ tầng

Bởi vì, điều thực sự quan trọng trong thời đại AI không chỉ là "mô hình lớn có thông minh", mà là khả năng mô hình có thể duy trì vận hành quy mô lớn, liên tục, với chi phí thấp trên toàn cầu. GoodVision AI cũng có giải pháp tối ưu riêng ở tầng này: hợp tác với các nhà cung cấp mô hình lớn, triển khai mô hình lớn trong các nhà máy AI, từ đó chuyển đổi từ dịch vụ thuê sức mạnh tính toán truyền thống sang cung cấp dịch vụ Token trực tiếp; không chỉ nâng cao lợi nhuận kinh doanh, mà còn mang lại trải nghiệm người dùng thân thiện hơn.

Lớp bánh kem thứ năm: Phân phối Token — "Lưới điện" của thời đại AI

Khi AIDC đã xây dựng xong, vấn đề tiếp theo xuất hiện: làm thế nào để các sức mạnh tính toán này được toàn thế giới sử dụng?

Vì vậy, các nền tảng cho thuê sức mạnh tính toán bắt đầu xuất hiện. Chúng giống như "hệ thống lưới điện" của thời đại AI, phân tách và phân phối các nguồn GPU tập trung, rồi cho thuê theo nhu cầu cho các nhà phát triển, doanh nghiệp và ứng dụng AI.

AWS, Azure, Google Cloud, Alibaba Cloud, Tencent Cloud vẫn là những người chơi mạnh nhất ở tầng này. Họ sở hữu hạ tầng đám mây lớn nhất toàn cầu, và đang dần tích hợp các nguồn GPU AI vào hệ sinh thái IaaS của mình.

Tuy nhiên, cùng lúc đó, các "đám mây gốc AI" bắt đầu bùng nổ nhanh chóng. CoreWeave, Nebius, Nscale, v.v., xây dựng các nền tảng GPU đám mây chuyên biệt cho nhu cầu huấn luyện và suy luận AI. So với các nhà cung cấp đám mây truyền thống, họ linh hoạt hơn, tập trung hơn vào nhiệm vụ AI, và giỏi tối ưu hóa các cụm GPU.

CoreWeave là một trong những công ty tiêu biểu của NeoCloud hiện nay. Ban đầu tập trung vào khai thác Ethereum, sau đó chuyển hướng toàn diện sang dịch vụ đám mây GPU AI, hiện đã trở thành đối tác chiến lược của NVIDIA trong hạ tầng AI.

DigitalOcean, Vultr, v.v., các nền tảng đám mây nhẹ, hướng tới các nhà phát triển nhỏ và startup, nhấn mạnh triển khai nhanh và chi phí thấp cho GPU.

Trong thị trường Trung Quốc, ngoài các ông lớn, các công ty như UCloud, Kingsoft Cloud, Capital Online, v.v., là các nhà cung cấp chính cho thị trường đám mây GPU và thuê sức mạnh tính toán AI. Cục diện cạnh tranh tầng này rất giống lưới điện thời kỳ đầu: làm thế nào phân phối hiệu quả các nguồn sức mạnh tính toán phân tán.

Lớp bánh kem thứ sáu: Tối ưu hóa Token và Điều phối thông minh — "Bộ não" của thời đại AI

Đây có thể là lớp "bánh kem" dễ bị bỏ qua nhưng lại quan trọng nhất. Khi số lượng AI Agent bùng nổ, mọi người nhận ra rằng không phải nhiệm vụ nào cũng xứng đáng gọi mô hình lớn đắt tiền nhất. Nhiều nhiệm vụ đơn giản có thể hoàn thành bằng mô hình cục bộ; nhiều nhiệm vụ thời gian thực phù hợp hơn với suy luận biên; nhiều nhiệm vụ riêng tư thậm chí không thể tải lên đám mây. Sau câu hỏi "có đủ sức mạnh tính toán" là một câu hỏi mới: "Làm thế nào để sử dụng sức mạnh tính toán một cách thông minh hơn".

Với nhu cầu Token tăng theo cấp số nhân, "để mô hình phù hợp xử lý nhiệm vụ phù hợp trên nền tảng phù hợp" chính là chìa khóa để Token được sử dụng hợp lý, hiệu quả. Đây cũng là hướng đi mà GoodVision AI đang nỗ lực ngoài việc xây dựng nhà máy Token AI của riêng mình.

Giống như hệ thống điện ngày nay: có nhu cầu từ lưới điện lớn; có nhu cầu từ năng lượng mặt trời trên mái nhà. Điều thực sự quan trọng là lớp "điều phối thông minh" ở trung gian.

Trong tương lai, AI cũng sẽ có cấu trúc tương tự: nhiệm vụ đơn giản do mô hình nhỏ tại chỗ hoàn thành, nhiệm vụ phức tạp gọi mô hình lớn đám mây, nhiệm vụ bảo mật cao xử lý tại biên, nhiệm vụ cao tần suất cao sẽ được điều phối động qua đám mây lai.

Ngoài GoodVision AI, các công ty như QingCloud, Lambda, OpenRouter, Fireworks AI, v.v., cũng là những người dẫn đầu trong tối ưu hóa Token và điều phối thông minh.

Và lớp "bánh kem" này có sự trùng lặp cao với hai lớp trước — AIDC và thuê sức mạnh tính toán. Khi nguồn GPU, các nút khu vực và quy mô các nhiệm vụ suy luận ngày càng mở rộng, việc chỉ sở hữu sức mạnh tính toán không còn đủ để xây dựng lợi thế dài hạn. Ngày càng nhiều nhà vận hành AIDC và nền tảng đám mây GPU nhận thức rằng, điều quyết định hiệu quả và lợi nhuận trong tương lai không chỉ là số lượng GPU, mà còn là cách điều phối mô hình, sức mạnh tính toán và luồng Token một cách linh hoạt.

Vì vậy, nhiều nền tảng đã ban đầu tập trung vào AIDC và đám mây GPU, nay bắt đầu mở rộng sang "lớp điều phối thông minh". Ví dụ, các công ty như UCloud, Inspur, Sugon, v.v., đang cố gắng kết hợp hệ thống GPU đám mây, đa đám mây và khả năng điều phối suy luận, dần chuyển từ "bán sức mạnh tính toán" sang "tối ưu hóa sức mạnh tính toán".

Lớp bánh kem thứ bảy: Mô hình và Agent — Người tiêu thụ Token

Lớp này dù gần nhất với người dùng cuối, cũng dễ dàng thu hút lưu lượng nhất, nhưng cạnh tranh cũng khốc liệt nhất. Tại GTC 2026, Huang Renxun đã đề xuất: "Trong tương lai, mọi công ty sẽ trở thành 'nhà sản xuất Token và người tiêu thụ Token'."

Một AI Agent có thể gọi nhiều mô hình, nhiều công cụ, nhiều API cùng lúc, và liên tục thực hiện suy luận, lập kế hoạch, thực thi. Điều này có nghĩa là, lượng Token tiêu thụ trong tương lai sẽ vượt xa quy mô đối thoại của con người và AI ngày nay. Một số người dùng AI nặng hiện nay, tự xây dựng hệ thống nhiều Agent đồng thời gọi và tương tác, tiêu thụ hàng tỷ Token mỗi ngày là chuyện bình thường.

Trong tương lai, không chỉ có 1 tỷ người dùng AI, mà có thể là 10 tỷ, thậm chí 100 tỷ AI Agent hoạt động đồng thời, gọi lẫn nhau. Và điểm nghẽn thực sự sẽ chuyển từ "khả năng của mô hình" sang "hiệu quả điều phối Token".

Các tập đoàn công nghệ lớn như Microsoft, Google, Meta, Amazon, v.v., đang tích hợp dần khả năng AI vào tất cả các sản phẩm qua hệ thống văn phòng, tìm kiếm, mạng xã hội và dịch vụ đám mây.

Các doanh nghiệp phần mềm doanh nghiệp như Adobe, Salesforce, ServiceNow, Palantir, v.v., đang đẩy nhanh tiến trình phát triển AI Agent doanh nghiệp và tự động hóa quy trình làm việc. Đồng thời, Hugging Face đang trở thành "Github của thời đại AI". Nó không chỉ là cộng đồng mô hình, mà còn là hạ tầng quan trọng của hệ sinh thái phát triển AI toàn cầu.

Ở thị trường Trung Quốc, các công ty như iFlytek, Kunlun Wanyou, 360, Kingsoft Office, SenseTime, v.v., đang mở rộng các lĩnh vực trợ lý AI, văn phòng AI và AI Agent.

Khi "bánh kem bảy lớp" thực sự hình thành, thế giới AI mới bắt đầu

Hiện tại, ngành AI vẫn còn trong giai đoạn xây dựng một hệ thống hạ tầng chưa hoàn chỉnh.

Có người sở hữu GPU tiên tiến nhất nhưng bị hạn chế bởi năng lượng; có người xây dựng AIDC khổng lồ nhưng thiếu điều phối hiệu quả; có người phát triển mô hình và Agent mạnh mẽ nhưng đối mặt chi phí suy luận cao và độ trễ lớn; có người nắm giữ các nút biên nhưng không thể hình thành mạng lưới hợp tác thống nhất.

Từ điện lực, AIDC, GPU, đến LLM, phân phối Token, điều phối thông minh và AI Agent, toàn bộ chuỗi ngành AI dù đang phát triển nhanh, nhưng vẫn còn tồn tại nhiều phân mảnh, dư thừa và điểm nghẽn về hiệu quả.

Chỉ khi hệ thống "bánh kem bảy lớp" này thực sự hoàn chỉnh và bắt đầu vận hành hợp tác hiệu quả, ngành AI mới có thể từ "Thời đại công cụ" bước vào "Thời đại ứng dụng quy mô lớn của thế giới thông minh".

Tương lai, thế giới AI sẽ không chỉ là một số ít tập đoàn công nghệ huấn luyện mô hình lớn, mà là hàng tỷ AI Agent liên tục trực tuyến, hợp tác, gọi sức mạnh tính toán và Token. Mỗi cuộc đối thoại, mỗi lần suy luận, mỗi lần gọi công cụ, mỗi lần tự động thực thi nhiệm vụ đều phản ánh sự phối hợp của năng lượng, GPU, mạng lưới, hệ thống điều phối và các nút suy luận.

Điều này cũng có nghĩa là, ngành AI đang dần chuyển từ "logic phần mềm" sang một hệ thống công nghiệp siêu lớn bao phủ năng lượng, chip, điện toán đám mây, mạng biên và điều phối thông minh.

Giống như cuộc cách mạng công nghiệp không chỉ cần máy hơi nước, mà còn cần đường sắt, lưới điện và cảng biển; cuộc cách mạng internet không chỉ cần PC, mà còn cần cáp quang, trung tâm dữ liệu và điện toán đám mây. Chứng chỉ trưởng thành của cuộc cách mạng AI không chỉ là một ứng dụng hot, mà còn là một "mạng lưới hạ tầng thông minh" toàn cầu có thể liên tục sản xuất, phân phối, điều phối và tiêu thụ Token.

Và khi hệ thống hạ tầng bảy lớp này cuối cùng thực sự kết nối, cạnh tranh trong ngành AI sẽ bị tái cấu trúc hoàn toàn. Những công ty quan trọng nhất trong tương lai có thể không còn là những công ty sở hữu mô hình lớn nhất, mà là những công ty có thể kết nối năng lượng, sức mạnh tính toán, mạng lưới, mô hình và luồng Token.

TOKEN-3,47%
SO1,67%
CRWV-4,92%
IREN-3,85%
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 12
  • 1
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
MildlyRugged
· 05-28 10:24
Điện lực→Công suất tính toán→Token, mỗi tầng đều rất cắt xén mạnh mẽ
Xem bản gốcTrả lời0
GateUser-1c5ab2b5
· 05-26 12:46
Bạn có liên kết báo cáo của JPMorgan không? Muốn xem cách tính cụ thể như thế nào.
Xem bản gốcTrả lời0
PositionLikeACat
· 05-26 06:57
Vì vậy, người chiến thắng cuối cùng là quốc gia có nguồn điện giá rẻ?
Xem bản gốcTrả lời0
ShellsLeftBehindByTheReceding
· 05-26 06:06
Từ bán cuốc đến bán Token, mô hình kinh doanh hoàn toàn đã thay đổi
Xem bản gốcTrả lời0
GateUser-04e4dac2
· 05-26 05:35
Cuộc chiến mô hình lớn đã kết thúc, bắt đầu cuộc chiến Token
Xem bản gốcTrả lời0
FlowingColorfulInkHeart
· 05-26 05:33
Nếu kinh tế token sụp đổ, các công ty AI này sẽ cần được đánh giá lại giá trị
Xem bản gốcTrả lời0
PaperSculptureOctopusPosition
· 05-26 05:32
Câu chuyện này chuyển đổi thật nhanh, năm ngoái còn nói về AGI, năm nay đã bàn về mô hình kinh tế rồi
Xem bản gốcTrả lời0
SudoSatoshi
· 05-26 05:29
Trong bảy lớp, cảm giác lớp ứng dụng là cạnh tranh nhất, còn hạ tầng lại có rào cản.
Xem bản gốcTrả lời0
WatercolorInAGlassBottle
· 05-26 05:25
Cách nói "bánh kem bảy lớp" khá sinh động, từ điện lực đến lớp ứng dụng đều có cơ hội kiếm lời chênh lệch.
Xem bản gốcTrả lời0
FlamingoFrontView
· 05-26 05:22
Chi phí điện chiếm bao nhiêu phần? Nền tảng của chiếc bánh này có đủ vững chắc không?
Xem bản gốcTrả lời0
Xem thêm
  • Đã ghim