Cơ bản
Giao ngay
Giao dịch tiền điện tử một cách tự do
Giao dịch ký quỹ
Tăng lợi nhuận của bạn với đòn bẩy
Chuyển đổi và Đầu tư định kỳ
0 Fees
Giao dịch bất kể khối lượng không mất phí không trượt giá
ETF
Sản phẩm ETF có thuộc tính đòn bẩy giao dịch giao ngay không cần vay không cháy tải khoản
Giao dịch trước giờ mở cửa
Giao dịch token mới trước niêm yết
Futures
Truy cập hàng trăm hợp đồng vĩnh cửu
TradFi
Vàng
Một nền tảng cho tài sản truyền thống
Quyền chọn
Hot
Giao dịch với các quyền chọn kiểu Châu Âu
Tài khoản hợp nhất
Tối đa hóa hiệu quả sử dụng vốn của bạn
Giao dịch demo
Giới thiệu về Giao dịch hợp đồng tương lai
Nắm vững kỹ năng giao dịch hợp đồng từ đầu
Sự kiện tương lai
Tham gia sự kiện để nhận phần thưởng
Giao dịch demo
Sử dụng tiền ảo để trải nghiệm giao dịch không rủi ro
Launch
CandyDrop
Sưu tập kẹo để kiếm airdrop
Launchpool
Thế chấp nhanh, kiếm token mới tiềm năng
HODLer Airdrop
Nắm giữ GT và nhận được airdrop lớn miễn phí
Pre-IPOs
Mở khóa quyền truy cập đầy đủ vào các IPO cổ phiếu toàn cầu
Điểm Alpha
Giao dịch trên chuỗi và nhận airdrop
Điểm Futures
Kiếm điểm futures và nhận phần thưởng airdrop
Đầu tư
Simple Earn
Kiếm lãi từ các token nhàn rỗi
Đầu tư tự động
Đầu tư tự động một cách thường xuyên.
Sản phẩm tiền kép
Kiếm lợi nhuận từ biến động thị trường
Soft Staking
Kiếm phần thưởng với staking linh hoạt
Vay Crypto
0 Fees
Thế chấp một loại tiền điện tử để vay một loại khác
Trung tâm cho vay
Trung tâm cho vay một cửa
Sau khi tăng 31.8%, chuyện bán API của Zhipu đã thành công chưa?
Văn/ A Ki
Hôm qua, Zhìpǔ (智谱) đã công bố kết quả kinh doanh cả năm 2025, đây cũng là báo cáo tài chính đầu tiên của họ sau khi lên sàn.
Trong cả năm đạt doanh thu 724M nhân dân tệ, tăng 131,9%; nhưng với sự thúc đẩy từ chi phí nghiên cứu và phát triển là 3.18B nhân dân tệ, lỗ ròng sau điều chỉnh đạt 3.18B nhân dân tệ.
Mặc dù thua lỗ nhiều như vậy, phản hồi của thị trường lại rất tích cực. Hôm nay, giá cổ phiếu của Zhìpǔ đã tăng 31,8%.
Trong đó, một nguyên nhân rất quan trọng là chuyện bán API trông có vẻ như đã chạy thông.
Năm 2025, doanh thu bán API tăng từ 48M nhân dân tệ của năm 2024 lên 48M nhân dân tệ, tăng 296%. Đồng thời, ban quản lý Zhìpǔ trong cuộc họp điện thoại cũng nêu rõ: hiện ARR của dịch vụ API vào khoảng 250 triệu USD, dự kiến đến cuối năm có thể đạt 3.18Bỷ USD.
Quan trọng hơn, đây không phải là một trường hợp đơn lẻ. Ở các công ty mô hình lớn khác, chúng ta cũng dần thấy xu hướng tương tự: lượng gọi Token đang tăng lên, và API đang trở thành một trong những con đường kiếm tiền trực tiếp nhất.
Vậy chúng ta nên nhìn nhận hiện tượng này như thế nào? Hôm nay, chúng ta sẽ kết hợp báo cáo tài chính của Zhìpǔ để nói rõ.
/ 01 /
Tăng trưởng mô hình gốc, dựa vào bán API
Trong báo cáo tài chính này của Zhìpǔ, thay đổi đáng chú ý nhất là sự chuyển dịch cơ cấu doanh thu.
Triển khai trên nền tảng đám mây đã trở thành nguồn tăng trưởng cốt lõi nhất. “Triển khai trên đám mây”, về bản chất, chính là dịch vụ API. Năm 2025, phần doanh thu này tăng từ 3.18Bỷ nhân dân tệ của năm 2024 lên 1Bỷ nhân dân tệ, tăng 296%; tỷ trọng doanh thu cũng tăng từ 15,5% lên 26,3%.
Tăng trưởng của API dựa trên logic cốt lõi là lượng gọi tăng lên.
Và đằng sau điều đó không thể thiếu sự thúc đẩy của OpenClaw. Khi Agent bắt đầu tự động thực thi nhiệm vụ, một nhu cầu thường tương ứng với nhiều lượt gọi; mức tiêu hao Token bị khuếch đại theo bội số, kéo theo lượng gọi API cũng tăng lên.
Dần dần, phía sau hình thành một nhận thức chung trong ngành: khi các mô hình lớn có năng lực thực thi nhiệm vụ tầm xa, việc gọi không còn dừng ở quá trình nhập-xuất đơn lẻ, mà tiến hóa thành một quá trình mang tính hệ thống có thể vận hành liên tục.
Trong cấu trúc này, bản thân Token trở thành đơn vị tính phí trực tiếp nhất, và cũng chắc chắn nhất.
Nói cách khác, khi năng lực của mô hình đủ mạnh, bản thân API sẽ tự hội tụ thành mô hình kinh doanh rõ ràng nhất của mô hình lớn.
Xu hướng này đang trở thành lựa chọn chung của các nhà cung cấp mô hình lớn.
Hải ngoại đi sớm hơn. Khoảng 80% doanh thu của Anthropic đến từ dịch vụ gọi API ở cấp doanh nghiệp; về bản chất, đó là hệ thống tính phí xoay quanh mức tiêu hao Token.
Trong nước cũng đang nhanh chóng tiến gần đến cấu trúc này.
Hiện nay, các công ty mô hình nền tảng chủ đạo trong nước, như Zhìpǔ AI, MiniMax, và bộ phận cốt lõi của phần “Moonshot”/“Yue Zhi An Miàn” (月之暗面), doanh thu chính đang dần hội tụ về việc gọi API; MaaS (Model as a Service) trở thành con đường chủ yếu để tiếp nhận tăng trưởng.
Ban quản lý Zhìpǔ trong cuộc họp điện thoại cũng nêu rõ: ARR của dịch vụ API hiện vào khoảng 250 triệu USD, dự kiến cuối năm có thể đạt 1.74Bỷ USD. Trong tương lai, công ty cũng sẽ tập trung hơn vào các dịch vụ API chuẩn hóa. Đến năm 2026, dịch vụ API và triển khai theo bản địa (localization deployment) dự kiến mỗi bên chiếm khoảng một nửa; về sau 2–3 năm, trọng tâm sẽ tiếp tục nghiêng mạnh hơn về phía API.
Những thay đổi tương tự cũng đang diễn ra ở MiniMax.
Năm 2025, doanh thu của nền tảng mở và dịch vụ doanh nghiệp đạt 25,96 triệu USD, tăng 197,8%; tỷ trọng doanh thu tăng từ 28,6% lên 32,8%.
Tính đến tháng 2/2026, ARR của công ty đã vượt 150 triệu USD; so với 79 triệu USD của tài khóa 2025, mức này đạt mức tăng gấp đôi. Động lực cốt lõi của tăng trưởng, cũng xuất phát từ việc tăng mức tiêu hao Token, đặc biệt là các kịch bản của trợ lý mã hóa và tác nhân thông minh (Agent) được mở rộng mạnh.
Goldman Sachs dự đoán rằng đến năm 2026, tỷ trọng doanh thu từ nền tảng mở (API) của MiniMax sẽ đạt khoảng 40%.
Việc “siết chặt” mô hình kinh doanh của mô hình lớn đồng nghĩa với việc cách đo lường giá trị cũng trở nên rõ ràng hơn: từ “chỉ số năng lực” chuyển sang “định lượng Token”.
/ 02 /
Sau sự phân hóa về lộ trình là hai cách giải khác nhau
Khi AI bước vào giai đoạn ứng dụng, một vấn đề bắt đầu trở nên cụ thể: khi năng lực mô hình dần hội tụ, năng lực cạnh tranh cốt lõi của mô hình lớn rốt cuộc là gì?
Về câu hỏi này, Zhìpǔ và MiniMax đưa ra hai cách giải khác nhau.
Logic của Zhìpǔ là theo đuổi giới hạn mô hình tối đa một cách cực đoan.
Trương Bằng đưa ra khái niệm TAC (Token Architecture Capability, năng lực kiến trúc Token). Về bản chất, khái niệm này có thể tách thành ba điểm: quy mô gọi, chất lượng gọi, và năng lực chuyển đổi thành doanh thu.
Kết luận cốt lõi của họ là: chất lượng của trí tuệ quyết định quyền định giá.
Quan điểm của Zhìpǔ là: “Khi Agent phát triển, Token cũng sẽ được phân tầng: token có độ phức tạp thấp, được tiêu chuẩn hóa sẽ đi về mức giá thấp thậm chí là miễn phí; chỉ những token chất lượng cao có độ phức tạp cao và độ tin cậy cao mới có quyền định giá bền vững.”
Điểm này đã thể hiện trên dữ liệu. Trong quý 1, giá API của Zhìpǔ tăng 83%, nhưng nhu cầu không hề co lại; ngược lại còn cho thấy tình trạng “cung không đủ cầu”, lượng gọi tăng tới 400%.
Nếu nói Zhìpǔ AI đang nói về “chất lượng quyết định quyền định giá”, thì MiniMax lại nói thật ra về một logic khác: năng lực cạnh tranh của mô hình đến từ “khác biệt hóa về lộ trình” và “hiệu quả”.
MiniMax chọn một lộ trình không phải phổ biến—tự nghiên cứu toàn đa phương thức với bốn mô thức văn bản, video, giọng nói, âm nhạc được phát triển song song. Điểm này, trong các nhà sản xuất mô hình lớn hiện nay không quá thường thấy.
Điểm cốt lõi của lộ trình này không nằm ở “nhiều”, mà nằm ở “rộng”.
Theo Yán Junjié, giá trị của một công ty nền tảng trong thời đại AI về bản chất là: “mật độ thông minh × lượng thông suốt Token”.
Ý nghĩa của đa phương thức là, trong khi không làm giảm đáng kể mật độ thông minh, sẽ khuếch đại lượng thông suốt Token. Bởi vì thứ nó thay đổi không phải là giới hạn năng lực, mà là ngưỡng sử dụng.
Khi sản phẩm thêm các phương thức tương tác như hình ảnh, giọng nói, chi phí hiểu và ngưỡng thao tác của người dùng sẽ giảm rõ rệt; nhóm người dùng cũng sẽ mở rộng ra những đối tượng rộng hơn, bao gồm cả người già, trẻ em—những nhóm trước đây khó được bao phủ.
Việc này thực ra đã từng xảy ra một lần trong internet di động—từ dòng thông tin hình ảnh và văn bản đến sự bùng nổ của video ngắn; về bản chất đều là thông qua việc hạ thấp ngưỡng tương tác để đạt bước nhảy về tỷ lệ thâm nhập.
Xem tiếp về hiệu quả. Luồng chính thứ hai của MiniMax là hiệu quả sử dụng tài nguyên ở mức cực đoan.
Năm 2025, công ty đầu tư 253 triệu USD cho R&D, tăng 33,8%, rõ ràng thấp hơn tốc độ tăng trưởng doanh thu 158,9%.
Ngược lại, chiến lược của Zhìpǔ AI gần hơn với kiểu “đánh lớn”.
Năm 2025, doanh thu của Zhìpǔ đạt 724 triệu nhân dân tệ, tương ứng chi phí R&D 724Mỷ nhân dân tệ, tỷ lệ chi phí R&D lên tới 439%; cùng kỳ, doanh thu MiniMax là 540 triệu nhân dân tệ, chi phí R&D là 190M nhân dân tệ, tỷ lệ chi phí R&D là 323%.
Về hiệu quả vận hành: mỗi 1 nhân dân tệ doanh thu của Zhìpǔ tương ứng khoảng 4,4 nhân dân tệ lỗ; MiniMax là 3,2 nhân dân tệ. Về năng suất nhân sự: Zhìpǔ khoảng 660 nghìn nhân sự, còn MiniMax đạt 1,26 triệu.
Tất nhiên, trong đó có một phần chênh lệch đến từ mô hình kinh doanh: MiniMax phụ thuộc nhiều hơn vào doanh thu từ sản phẩm, còn Zhìpǔ vẫn chủ yếu dựa vào triển khai theo bản địa.
Nhưng ngay cả như vậy, sự phân hóa giữa hai lộ trình vẫn rất rõ ràng:
Một bên theo đuổi “giới hạn thông minh”, giành quyền định giá bằng cách nâng cao năng lực;
Bên kia tối ưu “hiệu quả và mức độ phủ”, thông qua mở rộng quy mô sử dụng để khuếch đại lượng thông suốt Token.
Bản chất là, dưới cùng một công thức, có hai cách giải hoàn toàn khác nhau.
/ 03 /
Khuôn khổ đầu sỏ mới là độ chắc chắn lớn nhất của kinh doanh mô hình gốc
Bỏ qua vấn đề định giá (valuation) ra, thì ngành kinh doanh của các nhà sản xuất mô hình thực ra đã bắt đầu lộ ra một phác thảo tương đối rõ ràng.
Kinh doanh mô hình gốc này không giống phần mềm truyền thống.
Phần mềm truyền thống là chi đầu tư lớn ở giai đoạn đầu, sau đó dần thu hồi chậm; còn mô hình gốc thì khác: chi phí là kiểu tăng theo bậc thang, trong khi doanh thu lại không nhất thiết dày lên tương ứng, thậm chí có thể bị nén liên tục khi cạnh tranh gia tăng.
Nhìn từ góc độ này, nó giống một cấu trúc “bẩm sinh khá dễ vỡ”. Nhưng điều thú vị là, cấu trúc đó lại dẫn tới một kết quả khác:
Nó tự nhiên sẽ đi về phía đầu sỏ (oligopoly).
Bởi chỉ có rất ít công ty mới có thể liên tục chịu đựng mức đầu tư ở tầm này. Về hình thái kinh doanh, nó giống pin hoặc nhà máy wafer: đầu tư ban đầu cực lớn, nhưng một khi “chiếm được vị trí”, đối thủ rất ít, và chiếc bánh lại đủ lớn.
Đồng thời, mô hình lớn còn có một điểm tinh tế hơn nữa: nó không hoàn toàn là một thị trường “kẻ thắng ăn tất cả” (winner-takes-all), mà giống hơn là một thị trường phân tầng.
Ở tầng cao nhất, dù chỉ có lợi thế 5% về hiệu quả, trong các kịch bản phức tạp thiên về hiệu suất như coding, phần lợi thế đó sẽ bị phóng đại thành mức phụ trội (premium) hơn 50%—hiệu ứng này là do tác động nhân (multiplicative effect) quyết định.
Nhưng đồng thời, không phải mọi nhiệm vụ đều cần mô hình mạnh nhất.
Vì vậy thị trường sẽ tự nhiên phân tầng: tầng trên ăn premium, tầng trung chạy theo quy mô, tầng dưới đảm nhiệm nhu cầu đuôi dài (long tail). Thậm chí giữa các tầng, còn có thể hình thành một dạng “dòng chảy Token”—nhiệm vụ phức tạp đi lên, nhiệm vụ đơn giản đi xuống.
Dù bạn không đạt được SOTA trên toàn cục, thì làm được SOTA trong một lĩnh vực con cũng là một con đường có thể đúng.
Và trong cấu trúc này, hiệu quả cũng là một biến số cực kỳ then chốt.
Bởi trong ngành này gần như không có hiệu ứng mạng (network effects), chi phí chuyển đổi của người dùng rất thấp. Điều đó có nghĩa là, chỉ cần có công ty làm được một mô hình “90 điểm”, đồng thời giá lại thấp hơn, là có thể nhanh chóng mở rộng quy mô.
Trong quá trình này, hiệu quả cũng sẽ trở thành một biến số quan trọng trong quá trình thương mại hóa.
Do không có hiệu ứng mạng, chi phí chuyển đổi thấp: chỉ cần có công ty làm được một mô hình “90 điểm”, đồng thời giá thấp hơn, thì cũng có thể nhanh chóng tăng lượng tiêu thụ.
Nguyên nhân cũng rất trực tiếp: trong một số kịch bản, không nhất thiết phải dùng mô hình mạnh nhất. Khi khoảng cách hiệu quả là có giới hạn, giá sẽ trở thành yếu tố quyết định.
Và đằng sau giá, về bản chất là chi phí. Điều này không chỉ phụ thuộc vào công nghệ, mà còn là sự khác biệt của một loạt chi phí như năng lực tính toán (compute) và điện.
Lấy Trung Quốc làm ví dụ: thông qua tối ưu hóa kỹ thuật, triển khai theo quy mô và chi phí điện thấp hơn, có thể hạ đáng kể chi phí suy luận (inference). Điều này cho phép cùng mức năng lực, dùng giá thấp hơn để cung cấp dịch vụ Token ra bên ngoài.
Hiện nay, một phần các nhà sản xuất mô hình Trung Quốc ra biển về bản chất đang làm một cuộc kinh doanh “chênh lệch giá Token”.
Rõ ràng, tăng trưởng doanh thu đến từ nhu cầu bùng nổ và từ cấu trúc thị trường của đầu sỏ; tuy nhiên cũng không nên quá lạc quan, vì do khác biệt môi trường cạnh tranh, Trung Quốc và Mỹ vẫn có rất nhiều khác biệt khi bán API, ví dụ:
Chẳng hạn, hệ sinh thái mô hình lớn ở Mỹ phụ thuộc nhiều hơn vào nhu cầu đuôi dài của các nhà phát triển (developer); khách hàng doanh nghiệp và developer cũng sẵn sàng trả tiền cho năng lực, nên hiệu suất mô hình dễ chuyển hóa trực tiếp thành premium.
Trong khi đó, việc gọi ở trong nước lại tập trung nhiều ở các khách hàng đầu ngành, bao gồm các nền tảng Internet và khách hàng chính phủ/doanh nghiệp; cộng thêm cạnh tranh ở phía cung, premium của Token nhiều khả năng sẽ không tồn tại lâu dài.
Ở một mức độ nào đó, có thể nói rằng ở Mỹ, mô hình gốc giống một sự kết hợp giữa phần mềm và nền tảng hơn; còn ở Trung Quốc, nó lại giống như một phần của cơ sở hạ tầng.
Từ góc độ đó, mô hình kinh doanh của các công ty mô hình lớn trong nước rốt cuộc có thể chạy tới mức nào, có lẽ vẫn cần phải theo dõi thêm.