Google và Nvidia đặt cược vào OpenRouter: Khoảnh khắc mua sắm của kinh tế Token?

Một vòng gọi vốn 113 triệu USD đã trả lời hai câu hỏi mơ hồ trong ngành AI: đơn vị thanh toán của cuộc cách mạng công nghiệp này là gì, và ai sẽ xây dựng hạ tầng của nó.

13 tỷ USD không phải định giá cho một công ty, mà là giá trị của một vị trí trong nền kinh tế token.

Vào ngày 26 tháng 5 năm 2026, OpenRouter hoàn thành vòng gọi vốn Series B trị giá 113 triệu USD. Những gì họ làm không phức tạp — qua một API cho phép nhà phát triển và doanh nghiệp truy cập hơn 400 mô hình AI, tính phí thống nhất, định tuyến thông minh. Không tự tạo mô hình, không bán sức mạnh tính toán, thu lợi từ phí trung gian. 8 triệu người dùng, quy mô tăng gấp năm lần trong nửa năm.

Nhưng hãy xem ai đang đầu tư vào họ: CapitalG của Google dẫn đầu, NVentures của Nvidia theo sau, các phòng đầu tư chiến lược của ServiceNow, MongoDB, Snowflake, Databricks cùng tham gia, còn a16z và Menlo Ventures đều tăng vốn.

Một công ty tạo mô hình, một công ty tạo chip, cùng xuất hiện trong danh sách nhà đầu tư của một nền tảng phân phối token — và bước đi của Google, xa hơn cả chỉ là đầu tư tài chính. Cùng tháng đó, Palo Alto Networks mua lại đối thủ Portkey với định giá 120-140 triệu USD. Trong cùng một lĩnh vực, cả hai con đường gọi vốn độc lập và thoái vốn qua mua bán đều xuất hiện cùng lúc.

Đây không phải định giá cho một công ty. Đây là định giá cho một vị trí — cái trung gian giúp token lưu thông. Vị trí này cuối cùng sẽ lớn lên thành gì? Một bộ định tuyến, một mạng lưới điện, hay một chợ token của nền kinh tế token?

Mo Jomaa, đối tác của CapitalG: 「Mỗi lần nền tảng thay đổi đều tạo ra khoảng trống hạ tầng: trong thời đại internet có Cloudflare, trong thanh toán số có Stripe, trong dữ liệu có Databricks. OpenRouter là khoảng trống hạ tầng của thời đại suy luận AI.」

Mo Jomaa đúng về vị trí. Nhưng câu hỏi đáng đặt ra hơn là: tại sao lại là token?

Một, Token: Đơn vị thanh toán của thời đại AI

Token không phải nhiên liệu của AI. Nó là thước đo của AI.

Mỗi cuộc cách mạng công nghiệp đều phải chờ một thứ được chuẩn hóa để đo lường, định giá, giao dịch, rồi mới bắt đầu xây dựng hạ tầng xung quanh nó. Trước khi bán than theo tấn, nó chỉ là quặng; trước khi bán điện theo kWh, chỉ là hiện tượng trong phòng thí nghiệm; trước khi bán băng thông theo GB, chỉ là mạng học thuật.

Chìa khóa biến tài nguyên thành đơn vị kinh tế không nằm ở việc nó được sử dụng, mà ở chỗ nó có thước đo — có thước đo rồi mới có thị trường. Trong hai năm qua, thước đo của AI vẫn còn mơ hồ: sức mạnh tính toán, GPU, khả năng mô hình, dữ liệu — đều đúng, nhưng chưa đủ chính xác. Đó là công cụ sản xuất, không phải đơn vị thanh toán.

Vào tháng 3 năm 2026, Jensen Huang đã xác định câu trả lời tại hội nghị GTC. Ông không còn gọi trung tâm dữ liệu là "trung tâm dữ liệu", mà gọi chúng là "Nhà máy Token" — nguyên liệu là điện và dữ liệu, đơn vị kinh tế cơ bản là token. Trong cuộc cách mạng công nghiệp trước, nhà máy sản xuất điện; trong cuộc cách mạng này, nhà máy AI sản xuất trí tuệ.

Điện không phải là năng lượng mới, mà là tạo ra một giao diện chung — nó biến than, thủy lực, dầu mỏ — những năng lượng không thể hoán đổi — thành dạng chuẩn có thể truyền tải, lưu trữ, kiểm soát, cắm là chạy.

AI đang làm điều tương tự với trí tuệ. Khả năng phân tích của luật sư, khả năng mã hóa của lập trình viên, khả năng chẩn đoán của bác sĩ — những trí tuệ này trước đây chỉ tồn tại trong não bộ cá nhân, không thể lưu trữ, khi nghỉ việc là mất, chi phí truy cập cao và không ổn định, hơn nữa còn khó trao đổi xuyên biên giới.

Lần đầu tiên, token đã tách chúng ra khỏi não người, biến thành API chuẩn có thể truy cập 24/7. Điện chuẩn hóa năng lượng, token chuẩn hóa trí tuệ.

Nhưng token và điện có một khác biệt căn bản. Điện chỉ đóng vai trò vận chuyển: nó truyền năng lượng, không chứa thông tin, không mang theo đánh giá, không tạo thành sản phẩm. Token khác — nó vừa là nhiên liệu của AI (tiêu hao trong suy luận), vừa là sản phẩm (kết quả mô hình), đơn vị tính phí (mô hình kinh doanh), vừa là tài nguyên chiến lược (trọng điểm cạnh tranh địa lý), bốn trong một. Trong lịch sử kinh tế hiện đại, gần như không có hàng hóa nào đóng vai trò này cùng lúc.

Phán đoán này đã được xác nhận ở cấp chính sách. Ông Liu Lihong, giám đốc Tổng cục Thống kê dữ liệu quốc gia, đã đặt tên tiếng Trung cho token là "từ nguyên" — gọi nó là "đơn vị thanh toán" kết nối cung cấp công nghệ và nhu cầu thương mại. Dữ liệu ông tiết lộ chứng minh điều này đang tăng tốc: lượng từ nguyên gọi hàng ngày của Trung Quốc từ đầu năm 2024 là 1000 tỷ, đến tháng 3 năm 2026 đã tăng lên 140 triệu tỷ — tăng hơn nghìn lần trong hai năm. Ngày 22 tháng 5, trước bốn ngày công bố gọi vốn của OpenRouter, Tổng cục Thống kê đã tổ chức "Hội thảo về Kinh tế Từ nguyên", xác định thúc đẩy phát triển kinh tế từ nguyên vào hệ thống công việc.

Khi một đơn vị thanh toán đã được thị trường định giá, được quốc gia đặt tên, cuộc đua xây dựng hạ tầng xung quanh nó đã bắt đầu.

Hai, OpenRouter đã làm gì

Người từng xây dựng marketplace NFT lớn nhất, khi nhìn thấy thị trường token AI đã nhận ra cùng một cấu trúc cơ bản — phương pháp luận giống hệt.

Người sáng lập OpenRouter, Alex Atallah, là đồng sáng lập và CTO của OpenSea, thành lập năm 2017 cùng Devin Finzer, rời đi năm 2022. Bản chất của OpenSea là cửa ngõ lưu lượng + giao diện chuẩn hóa + phí hoa hồng — người mua không cần biết NFT được đúc trên chuỗi nào, nền tảng lo hết. Atallah đã chuyển mô hình này sang AI: kệ hàng từ JPEG đổi thành LLM, định giá từ ETH sang token.

Ông xây dựng thứ gọi là OpenRouter, định vị chính thức là "Sàn giao dịch mô hình AI" — qua một API, cho phép nhà phát triển và doanh nghiệp truy cập hơn 400 mô hình của các nhà cung cấp như Anthropic, Google, OpenAI, xAI, DeepSeek, theo nhu cầu, định tuyến thông minh, tính phí thống nhất. Hiện tại phục vụ hơn 8 triệu người dùng, mỗi tuần xử lý 25 nghìn tỷ tokens — cách đây nửa năm là 5 nghìn tỷ.

(Một cuộc trò chuyện không lọc với Alex Atallah, CEO của OpenRouter)

Tại sao tăng trưởng nhanh như vậy? Trong bài đăng trên blog sau khi dẫn đầu vòng gọi vốn của Menlo Ventures, họ phân tích một insight cốt lõi:

Việc sử dụng AI quy mô lớn về cơ bản là vấn đề đa mô hình. Bạn không cần phải mua Ferrari để đi chợ, nhưng cũng không thể đi xe đạp trên cao tốc — tóm tắt tài liệu thì đủ dùng mô hình nhỏ rẻ, suy luận sâu thì cần flagship, đa mô hình lại là một giải pháp khác.

Khảo sát của Deloitte năm 2026 cho thấy, 67% doanh nghiệp tiêu thụ hơn 10 tỷ tokens mỗi tháng, trong khi F5 khảo sát cho biết trung bình mỗi doanh nghiệp vận hành 7 mô hình AI khác nhau cùng lúc. Và cùng một mô hình chạy trên các nhà cung cấp khác nhau, độ trễ, giá cả, thậm chí chất lượng đầu ra đều khác biệt. Thêm nữa, phần lớn API LLM không đạt 90% uptime, mỗi công ty quản lý khóa và thanh toán riêng — doanh nghiệp không thiếu mô hình. Thiếu là lớp trung gian giúp tất cả mô hình có thể dùng chung.

Andrej Karpathy gọi OpenRouter là "công tắc chuyển đổi" (transfer switch) của AI: nó không tạo ra điện, không sản xuất thiết bị điện, nhưng quyết định nguồn điện đến từ đâu, phân phối thế nào. Nhưng giá trị của nó không chỉ dừng lại ở định tuyến.

Điều OpenRouter làm, về bản chất, là trang bị cho mỗi máy một động cơ riêng: giúp doanh nghiệp tổ chức khả năng AI theo nhu cầu kinh doanh chứ không theo nhà cung cấp mô hình. Đây không chỉ là giảm chi phí, nâng cao hiệu quả, mà còn là cuộc cách mạng tổ chức.

Gần đây, Vercel AI Gateway đã công bố một bộ dữ liệu sản xuất xác thực cho logic này. Tháng 4 năm 2026, theo tiêu chí tiêu thụ, Anthropic chiếm 61%, Google 21%, OpenAI 12%; nhưng theo lượng token, Google chiếm 38%, Anthropic 26%, OpenAI 13%. Mô hình rẻ tiêu thụ nhiều, mô hình đắt tiêu thụ tiền — cùng một nhóm khách hàng, họ chọn ra hai "kẻ thắng" hoàn toàn khác nhau trên hai tiêu chí. Đây chính là ý nghĩa thực sự của "đa mô hình": không phải chọn mô hình tốt nhất, mà là chọn mô hình phù hợp nhất cho từng bối cảnh.

Ba, tại sao vị trí này lại quan trọng nhất trong nền kinh tế token

Khi không có mô hình nào có thể xử lý tất cả các tình huống, giá trị của lớp trung gian mới xuất hiện. Phán đoán này không chỉ là suy luận của nhà phân tích.

3.1 Phán đoán tập thể của các nhà đầu tư

(OpenRouter Raises $113M Series B)

Danh sách nhà đầu tư trong vòng gọi vốn này không chỉ là "một nhóm VC thích một công ty" — đó là sự tập hợp của các bên trong chuỗi ngành AI từ trên xuống dưới.

CapitalG (Google/Alphabet) dẫn đầu. Google có Gemini, nhưng họ đặt cược vào một nền tảng phân phối mô hình trung lập. Điều này không mâu thuẫn — Google có Gemini nhưng không thể thắng tất cả khách hàng, hỗ trợ một nền tảng phân phối trung lập giúp mô hình của Google cũng được phân phối trong đó.

Đối tác của CapitalG, Jane Alexander, nói thẳng hơn: 「OpenRouter có vị trí đặc biệt, có thể trở thành trung tâm thanh toán dữ liệu và lớp trí tuệ thống nhất của AI.」

Nhưng nếu chỉ hiểu đơn thuần là "Google muốn phân phối Gemini" thì đã đánh giá thấp bước đi này.

Xem ba hành động của Google trong tháng 5 cùng nhau: CapitalG dẫn đầu vòng gọi vốn OpenRouter (lớp định tuyến — bộ não của Agent qua ai), hiệp định AP2 quyên góp cho FIDO Alliance (lớp giao thức — Agent dùng ví nào để ủy quyền), hội nghị I/O ra mắt Universal Cart (lớp vào cửa — nơi Agent hoàn tất mua hàng trong hệ sinh thái của ai). Lớp giao thức mở, Google không cần thắng trong cuộc chiến giao thức; họ cần trở thành lựa chọn mặc định ở lớp định tuyến và lớp vào cửa.

Khi ba bước chọn mô hình, cấp phép, hoàn tất mua hàng đều chịu ảnh hưởng của Google, thì không phải là giao thức, mà là ba điểm đón dòng chảy.

NVentures (Nvidia) theo sau. Lợi ích của Nvidia rất rõ ràng — nhiều token tiêu thụ hơn = nhiều sức mạnh suy luận được sử dụng hơn = nhiều GPU được mua hơn. OpenRouter là bộ khuếch đại lượng suy luận. Cách này tương tự như Nvidia đầu tư vào CoreWeave: không quan tâm mô hình nào thắng, mà quan tâm đến việc mở rộng quy mô toàn bộ hệ thống.

ServiceNow / MongoDB / Snowflake / Databricks cùng tham gia phòng đầu tư chiến lược. Những công ty này đều là hạ tầng phần mềm doanh nghiệp. Việc họ cùng tham gia cho thấy khách hàng doanh nghiệp đang nâng cấp từ "lựa chọn công nghệ" sang "hạ tầng tiêu chuẩn" cho đa mô hình.

a16z / Menlo Ventures / Sequoia đều tăng vốn. Năm ngoái, Menlo đầu tư khi OpenRouter có 2,5 triệu nhà phát triển, xử lý khoảng 100 nghìn tỷ tokens mỗi năm. Giờ đây, đã có 8 triệu nhà phát triển, xử lý khoảng 1,5 triệu tỷ tokens mỗi năm. Deedy Das của Menlo so sánh ấn tượng: lượng token của OpenRouter đã tương đương 15-30% của Google, 20-40% của OpenAI, hơn 50% của Azure Foundry. Và ông tiết lộ, từ tháng 2 ký hợp đồng đến tháng 5 công bố, doanh thu đã tăng gấp đôi.

Khi nhà cung cấp mô hình (Google), nhà sản xuất chip (Nvidia), công ty phần mềm doanh nghiệp (ServiceNow/Databricks/Snowflake/MongoDB), các quỹ VC hàng đầu (a16z/Sequoia/Menlo) cùng xuất hiện trong một bảng cổ phần, đây không chỉ là ủng hộ một công ty. Đây là toàn bộ chuỗi ngành dùng tiền thật để bỏ phiếu.

3.2 Chứng cứ từ dữ liệu ngành

TechCrunch nhận định: 「Thành công của OpenRouter có nghĩa là mô hình AI đang trở thành những động cơ không thể nhìn thấy, có thể hoán đổi cho nhau. Các doanh nghiệp không còn muốn bị khóa trong một nhà cung cấp như thời SaaS. Tương lai đa mô hình đã đến rồi.」

Và sự trỗi dậy của các mô hình Trung Quốc càng làm cho phán đoán này vững chắc hơn. Trong dịp Tết Nguyên đán 2026, mô hình Trung Quốc từng chiếm tới 61% lượng token tiêu thụ trên nền tảng OpenRouter. Khi các mô hình Mỹ và Trung Quốc cùng xuất hiện trên một nền tảng, được các nhà phát triển toàn cầu theo nhu cầu lựa chọn, đa mô hình không còn là xu hướng nữa, mà là thực tế.

Nhưng điểm mấu chốt không phải là "đa mô hình" — mà là ai kiểm soát cổng vào giữa mô hình và người dùng.

Bảng xếp hạng mô hình của OpenRouter đã trở thành một trong những chỉ số phổ biến nhất để đánh giá mô hình AI toàn cầu — nhà đầu tư, nhà nghiên cứu, truyền thông đều theo dõi để đoán xu hướng. Khi toàn ngành dựa vào dữ liệu của bạn để ra quyết định, bạn không chỉ là một bộ định tuyến, mà còn là trung tâm thông tin của toàn hệ sinh thái. Đây không chỉ là chức năng phụ, mà là quyền lực cấu trúc: mỗi lần định tuyến là một lần thu thập dữ liệu, mỗi dòng lưu lượng là bản đồ nhu cầu AI toàn cầu theo thời gian thực.

Trong thời đại điện khí hóa, quyền lực cuối cùng không nằm ở nhà máy phát điện, mà là ở mạng lưới điện. Thời đại internet, không phải là website, mà là công cụ tìm kiếm và cửa hàng ứng dụng. Trong nền kinh tế token, phòng thí nghiệm mô hình là nhà máy phát điện, doanh nghiệp và agent dùng mô hình là thiết bị cuối, còn lớp định tuyến — chính là mạng lưới điện.

Ai nắm giữ cổng vào này, người đó sẽ nắm trong tay bản đồ của nền kinh tế token.

Bốn, Tương lai của nền kinh tế token: thương mại điện tử có thể dạy chúng ta điều gì

Headless merchant đã xuất hiện. Nhưng chưa ai trả lời được họ nên xuất hiện ở đâu.

Noah Levine của a16z đã định nghĩa khái niệm này vào tháng 3: không có cửa hàng, không hệ thống tài khoản, không đội bán hàng, chỉ có một máy chủ, một nhóm API, một mức giá tính theo lượt.

Trong tuần đầu tiên ra mắt, hơn 60 dịch vụ headless đã đưa lên, 894 agent đã thực hiện 31.000 giao dịch. Cuy Sheffield của Visa và Levine đã thảo luận trong podcast về xu hướng này — pay-per-token đang thay thế mô hình đăng ký, agent đang thay thế người tiêu dùng. Định nghĩa đã rõ ràng, giao thức đã có, giao dịch đã bắt đầu.

Nhưng những headless merchant này xuất hiện ở đâu?

60 dịch vụ có thể đặt trong một thư mục. 6.000? 60.000? Agent về lý thuyết có thể tự tìm API trên toàn mạng, nhưng thực tế cần một nơi có xếp hạng, dữ liệu độ tin cậy, và tính phí thống nhất để phát hiện và so sánh. Nơi đó gọi là marketplace.

Hôm nay, OpenRouter chính là hình thái sơ khai của marketplace này — chỉ có điều, trên kệ hàng hiện tại chỉ có một loại headless merchant: nhà cung cấp LLM. Nếu dựa theo lộ trình mở rộng của OpenSea từ một loại hình (avatar PFP) sang tất cả các loại tài sản số, thì danh mục headless merchant sớm muộn cũng sẽ mở rộng từ LLM sang tạo hình ảnh, truy vấn dữ liệu, xử lý tài liệu, xác thực thanh toán — đây là dự đoán, nhưng không phải là dự đoán chưa có tiền lệ.

Nếu dựa theo lộ trình phát triển của thương mại điện tử, thì tiến trình của token marketplace có khả năng trải qua ba giai đoạn:

Giai đoạn 1: Thiết lập tiêu chuẩn marketplace. Giống như thời kỳ đầu của Taobao định nghĩa danh mục hàng hóa, xếp hạng tìm kiếm, đánh giá tín dụng, thanh toán thống nhất, OpenRouter đang dùng hàng triệu giao dịch để định nghĩa "một API LLM nên như thế nào" — quy chuẩn đặt tên, định dạng giá, chỉ số khả dụng, tham số ngữ cảnh. Những điều này không do một ủy ban thiết kế, mà rút ra từ thực tiễn giao dịch hàng loạt. Tiêu chuẩn không thể khởi đầu từ con số 0.

Giai đoạn 2: Phát triển hệ sinh thái. Đây là lớp mỏng nhất của OpenRouter hiện tại. Theo mô hình thương mại điện tử: lợi thế cạnh tranh của Taobao không chỉ nằm ở chức năng tìm kiếm, mà còn ở trang trí shop, quảng cáo trực tiếp, hệ thống đánh giá tích cực, dịch vụ tín dụng như Huabei. OpenRouter còn thiếu các công cụ đề xuất (từ định tuyến tiến tới "Bạn cần gì?"), đánh giá theo kịch bản (không chỉ tổng lượt gọi, mà còn theo phân cảnh pháp lý, mã, dịch thuật), công cụ tài chính (đặt trước token, quản lý ngân sách, tín dụng tiêu dùng), và hệ sinh thái bên thứ ba (plugin, fine-tune, marketplace prompt). Tất cả cộng lại mới tạo thành lợi thế cạnh tranh.

Giai đoạn 3: A2A từ marketplace phát triển ra ngoài. Khi tiêu chuẩn đủ chín muồi, dữ liệu đủ đáng tin cậy, khách hàng lớn sẽ "tốt nghiệp" — trực tiếp kết nối với headless merchant, không qua marketplace nữa. Giống như các thương hiệu lớn từ Taobao chuyển sang mở cửa hàng Shopify riêng, các doanh nghiệp lớn tự xây dựng route riêng với LiteLLM. Nhưng marketplace không biến mất — nó trở thành lớp khám phá và lớp tin cậy, dành cho khách hàng nhỏ và dịch vụ dài đuôi luôn duy trì trên nền tảng.

Trong lịch sử, mỗi bước đều theo thứ tự này: trước có sàn giao dịch tập trung (NYSE) xây dựng tiêu chuẩn thanh toán, rồi mới có điện tử hóa và dark pool; trước có SWIFT, Visa xây dựng mạng lưới thanh toán, rồi mới có P2P, thanh toán trên chuỗi; trước có Amazon, Taobao xây dựng tiêu chuẩn thương mại điện tử, rồi mới có Shopify giúp thương nhân tự lập cửa hàng.

Chuyển từ tập trung xây dựng tiêu chuẩn và niềm tin, sang phi tập trung kế thừa tiêu chuẩn và niềm tin.

Đây chính là thử thách thực sự của OpenRouter. Tỷ lệ phí 5% trong mắt khách hàng lớn là chi phí đáng kể — các doanh nghiệp tiêu thụ suy luận hơn 37.000 USD mỗi tháng sẽ tự xây dựng LiteLLM mở nguồn để tiết kiệm hơn. Vercel AI Gateway đã đạt mức không tính phí token, Cloudflare tích hợp AI Gateway thành chức năng miễn phí.

Trên Trends.vc, nhận định khá bình tĩnh: 「Khi một nhà chơi có vốn cam kết giá passthrough, các đối thủ sẽ theo. Lợi nhuận sẽ dịch chuyển từ định tuyến sang cache, governance và tích hợp sâu hơn.」

Thị trường thương mại điện tử cuối cùng đã trả lời câu hỏi: Taobao thắng trong cuộc tranh luận "tại sao không tự xây website bán hàng" không phải vì chức năng tìm kiếm quá tốt, mà vì khách hàng, đánh giá, niềm tin đều ở đó.

OpenRouter có thể đi đến bước đó hay không, phụ thuộc vào khả năng làm dày hệ sinh thái trước khi tỷ lệ phí bị ép chặt. Định giá 13 tỷ USD không phải là cho 5% hoa hồng hôm nay — mà là cho khả năng tiến hóa từ marketplace thành hệ điều hành này có thể hoàn thành hay không.

Năm, Kết luận

OpenRouter có thể trở thành người chiến thắng cuối cùng hay không là một câu hỏi mở. Nhưng vòng gọi vốn này đã đánh dấu một điểm không thể đảo ngược — tiêu chuẩn đang được định nghĩa bởi lượng giao dịch, niềm tin đang tích lũy qua nền tảng. Vấn đề không còn là "có nên xây hạ tầng token hay không", mà là ai xây dựng ra sẽ được kế thừa.

Còn việc đây có phải là thời điểm chợ của nền kinh tế token hay không — câu trả lời phụ thuộc vào ai xây dựng hệ sinh thái dày đặc trước. Thời gian đã bắt đầu mở ra.

GOOGLX-2,34%
TOKEN2,25%
NVDA-3,32%
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim