Báo cáo tài chính đầu tiên của Zhipu đã được công bố, phát biểu mới nhất của Zhang Peng: Định nghĩa lại "nguyên lý đầu tiên" trong thương mại hóa AGI, giới hạn trí tuệ quyết định quyền định giá

Vừa rồi, Zhipu sau 83 ngày niêm yết, báo cáo tài chính đầu tiên đã đến!

Những dữ liệu sáng giá nhất đến mức khiến người ta phải nhìn chằm chằm, không gì khác ngoài doanh thu của Zhipu—

Cả năm đạt 7,24 tỷ nhân dân tệ, tăng trưởng 132% so với cùng kỳ, đứng đầu quy mô công ty mô hình ngôn ngữ (LLM) lớn có doanh thu lớn nhất trong nước!

Khi toàn ngành LLM đang sa lầy trong cuộc chiến giá cả, dựa vào đốt tiền để đổi lấy quy mô, thì Zhipu vừa lên sàn lại có thể nói là đã đi ngược hẳn một con đường hoàn toàn khác chỉ với báo cáo tài chính đầu tiên này.

Hãy nhìn thẳng thêm vài nhóm dữ liệu then chốt:

  • ARR của nền tảng MaaS API khoảng 1,7 tỷ nhân dân tệ, trong 12 tháng qua tăng 60 lần

  • Sau khi tăng giá ngược thế 83%, lượng gọi token không những không giảm mà còn tăng liên tục

  • Biên lợi nhuận gộp tăng gần 5 lần lên 18,9%, biên lợi nhuận gộp tổng hợp cả năm của công ty đạt 41%, phá tan “ma chú” AI trong ngành “tăng doanh thu nhưng không tăng lợi nhuận”

Hầu như mọi con số đều đang phá vỡ, đang phá vỡ định kiến cố hữu của ngành.

Từng được bên ngoài gọi là “OpenAI phiên bản Trung Quốc”, Zhipu giờ đây về mô hình kinh doanh ngày càng rời xa OpenAI, nhưng lại ngày càng giống Anthropic.

Báo cáo tài chính này cho thấy: điểm kết thúc trong thương mại của LLM, từ trước tới nay không phải là so xem ai rẻ hơn, mà là so xem ai tạo ra giá trị cao hơn.

Đúng như CEO Zhipu Trương Bành đã nói trong cuộc họp điện thoại vừa diễn ra:

Từ khi Zhipu thành lập vào năm 2019, chúng tôi đặt “khiến máy móc suy nghĩ như con người” làm mục tiêu chiến lược duy nhất của công ty. Trong sáu năm qua, mục tiêu này chưa từng dao động. Chúng tôi cũng đã trải qua những nghi ngờ, những lần vấp ngã, nhưng vô số sự thật liên tục xác thực một phán đoán—việc nâng cao ngưỡng trí tuệ là “sự đầu tiên” duy nhất trong thời đại AGI của mô hình LLM.

Trên cơ sở “nguyên lý thứ nhất” đó, chúng tôi còn nhận ra thêm: chất nền để trí tuệ phổ cập đến mọi người đại chúng chính là Token. Mỗi người, mỗi tổ chức đều có thể tạo ra giá trị thông qua việc gọi trí tuệ bằng Token. Vì vậy, giá trị thương mại trong thời đại AGI có thể được quy về một công thức ngắn gọn: ngưỡng trí tuệ × quy mô tiêu thụ Token. Ngưỡng trí tuệ quyết định quyền định giá, quy mô tiêu thụ Token quyết định quy mô giá trị.

Công ty LLM của Trung Quốc chạy như thế nào, xem Zhipu

Muốn hiểu trọng lượng của báo cáo tài chính này của Zhipu, trước hết phải nhìn rõ hiện trạng sinh tồn của ngành LLM Trung Quốc lúc này.

Từ giữa năm 2024 đến nay, chiến tranh giá không nghi ngờ gì nữa đã trở thành chiến trường sinh tử mà mọi bên trong giới LLM đều lao vào.

1 xu mua 1 triệu Token, gọi miễn phí để lấy lưu lượng—người chơi dùng giá để đổi lấy quy mô, càng giảm giá càng không có lợi nhuận, càng khó đầu tư vào nghiên cứu công nghệ, tạo thành vòng lặp chết người: giảm giá mãi.

Đây là tình thế thua lỗ mà toàn ngành khó thoát khỏi.

Dữ liệu khảo sát cho thấy, năm 2024, biên lợi nhuận gộp trung bình của ngành LLM trong nước là -80%, hoàn toàn ở giai đoạn thuần đầu tư; đến năm 2025, biên lợi nhuận gộp trung bình của ngành vẫn là -30%, đa số người chơi vẫn đang dựa vào đốt tiền để duy trì tăng trưởng quy mô.

Giảm giá chỉ mang lại sự phồn vinh “giả” về lượng gọi, nhưng không có một vòng khép kín thương mại lành mạnh—

Càng giảm giá, càng không có tiền để đầu tư nghiên cứu và phát triển công nghệ, chất lượng mô hình càng khó cải thiện, cuối cùng chỉ có thể rơi vào “vòng lặp xấu: dùng giá thấp để giữ chân nhóm khách hàng có giá trị thấp nhưng nhạy với giá”.

Kẻ đi ngược chiến tranh giá

Ngay khi toàn ngành đều đang so xem ai có giá thấp hơn, Zhipu lại làm một quyết định khiến tất cả bất ngờ: tăng giá.

Tháng 3/2026, Zhipu ra mắt mô hình GLM-5-Turbo, đồng thời điều chỉnh tăng giá API, mức tăng trung bình so với thế hệ trước GLM-4.7 đạt 83%. Trong bối cảnh cả ngành đều đang giảm giá, việc tăng giá quy mô lớn như vậy từng bị bên ngoài cho rằng là “tự cắt đứt đường sống”.

Nhưng rốt cuộc, kết quả lại tát thẳng vào mặt tất cả những người nghi ngờ: sau khi tăng giá, lượng gọi Token của Zhipu không những không giảm mà còn tiếp tục leo dốc.

Trong vòng 24 giờ sau khi GLM-5 ra mắt, Zhipu đã nhận được kết nối chính thức từ các nền tảng hàng đầu như TRAE/Coze của ByteDance, Qoder của Alibaba, CodeBuddy của Tencent, CatPaw của Meituan, Vanke? của Kuaishou (WanQing), Baidu Intelligent Cloud và WPS Office, v.v.

Trong số 10 công ty Internet hàng đầu Trung Quốc, 9 công ty đã trở thành khách hàng trả phí của Zhipu.

Logic đằng sau thực ra rất đơn giản: đối với các khách hàng doanh nghiệp có nhu cầu cấp độ sản xuất thực sự, giá từ trước tới nay không phải là yếu tố cân nhắc đầu tiên, hiệu quả mới là điều quyết định.

Một mô hình có thể ổn định hoàn thành nhiệm vụ phức tạp, không sai, và thực sự giúp giảm chi phí tăng hiệu quả—dù giá có thể cao hơn một chút—cũng có giá trị cao hơn rất nhiều so với một mô hình rẻ nhưng thường xuyên “lật kèo”.

Như một nhà phát triển đã nói trong cộng đồng:

Chúng tôi dùng LLM để chạy nghiệp vụ sản xuất. Chỉ một lần sai có thể gây thiệt hại vài chục nghìn hoặc thậm chí vài trăm nghìn. Thay vì nơm nớp lo sợ vì tiết kiệm chút tiền Token, không bằng bỏ thêm tiền để dùng một mô hình đáng tin cậy.

Zhipu đã dùng đợt tăng giá này để xác thực một phán đoán cốt lõi: ngưỡng trí tuệ quyết định quyền định giá, quy mô tiêu thụ Token quyết định quy mô giá trị.

Khi hiệu quả mô hình của bạn đủ mạnh, có thể thực sự giải quyết các vấn đề cốt lõi của khách hàng, bạn sẽ có nền tảng cho định giá, thay vì bị ép phải cuốn vào cuộc chiến giá cả không có hồi kết.

Cỗ máy bay (flywheel) MaaS đã quay

Nhiều người vẫn đang dừng lại ở nhận thức rằng Zhipu dựa vào việc làm dịch vụ LLM cho doanh nghiệp để lấy doanh thu.

Nhưng báo cáo tài chính này đã hoàn toàn phá vỡ ấn tượng đó: doanh thu MaaS API tiêu chuẩn hóa đã trở thành động cơ tăng trưởng cốt lõi tuyệt đối của Zhipu; vòng quay của mô hình kinh doanh MaaS đã hoạt động toàn diện.

MaaS là gì? Model as a Service, mô hình như một dịch vụ.

Nói đơn giản, đó là việc đóng gói năng lực của LLM thành một API tiêu chuẩn hóa. Doanh nghiệp và nhà phát triển thanh toán theo số lần gọi, không cần tự triển khai hay vận hành mô hình, vẫn có thể trực tiếp sử dụng năng lực của những LLM đỉnh cao.

Đây chính là lộ trình thương mại mà Anthropic đã chạy thông. Với vai trò đối thủ cạnh tranh quan trọng nhất của OpenAI, Anthropic ngay từ khi thành lập đã kiên định đi theo hướng “mô hình nền + dịch vụ API”; hơn 80% doanh thu đến từ các lượt gọi API của doanh nghiệp và nhà phát triển.

Năm 2025, doanh thu cả năm của Anthropic đạt 4,5 tỷ USD, tăng vọt 12 lần so với năm 2024. Đến cuối năm, ARR cũng vượt mốc 9 tỷ USD; biên lợi nhuận gộp từ mức -94% của năm 2024 đã chuyển mạnh sang 40%, dùng kết quả thực tế để chứng minh tính khả thi của mô hình MaaS.

Còn Zhipu, đang đi một con đường có mức độ đồng nhất rất cao với Anthropic: lấy ngưỡng năng lực trí tuệ của mô hình làm rào cản nền tảng; lấy Token làm hình thái sản phẩm chính; dùng việc nhà phát triển và khách hàng ở cấp doanh nghiệp sử dụng sâu để tạo động lực tăng trưởng.

Phần cốt lõi của tăng trưởng không phải dựa vào các dự án tùy chỉnh một lần, mà dựa vào việc trí tuệ của mô hình được doanh nghiệp và nhà phát triển thực sự dùng đến, được đưa vào khâu sản xuất, từ đó tạo ra doanh thu bền vững, có thể mở rộng theo quy mô.

Các dữ liệu trong báo cáo tài chính này cũng gián tiếp chứng thực việc flywheel đang vận hành:

  • MaaS API nền tảng trong năm qua đạt khoảng 1,7 tỷ nhân dân tệ ARR; trong 12 tháng qua tăng 60 lần;

  • Nền tảng đã phục vụ 4 triệu người dùng doanh nghiệp và nhà phát triển, phủ hơn 218 quốc gia và khu vực trên toàn cầu;

  • Zhipu đã trở thành một trong những nhà cung cấp có lượng tiêu thụ Token trả phí cao nhất trong nước. Ở kịch bản Coding, nền tảng cơ bản duy trì ổn định; riêng sự bùng nổ của các ứng dụng như OpenClaw còn mở ra một không gian mới cho việc tiêu thụ quy mô Token.

Logic của flywheel này, thực chất là một chu trình chính diện hoàn hảo: chất lượng mô hình càng tốt, càng thu hút khách hàng doanh nghiệp giá trị cao; mức gọi sâu của khách hàng giá trị cao mang lại doanh thu và lợi nhuận tăng trưởng ổn định; doanh thu nhiều hơn lại được đầu tư vào nghiên cứu phát triển công nghệ, tiếp tục nâng cao hiệu quả mô hình.

Dùng công nghệ để đổi lấy lợi nhuận

Mô hình MaaS là một mô hình có chi phí biên liên tục giảm và hiệu ứng quy mô cực mạnh.

Mô hình chỉ cần huấn luyện và tối ưu hóa một lần là có thể phục vụ hàng triệu khách hàng trên toàn cầu. Lượng gọi càng lớn thì chi phí cho mỗi Token càng thấp, biên lợi nhuận gộp càng cao.

Đó cũng là lý do vì sao Zhipu trong báo cáo tài chính này có thể thực hiện bước nhảy vọt về biên lợi nhuận gộp. Báo cáo cho thấy, biên lợi nhuận gộp của nền tảng MaaS API của Zhipu so với năm trước tăng gấp 5 lần. Biên lợi nhuận gộp tổng hợp cả năm chuyển sang dương mạnh mẽ, vượt xa mức trung bình của ngành.

Động lực cốt lõi cải thiện lợi nhuận đến từ ba phương diện:

  • Thứ nhất là tối ưu hóa cực hạn hiệu quả suy luận mô hình. Thông qua đổi mới về kiến trúc và tối ưu kỹ thuật, chi phí suy luận cho mỗi Token đã được đưa về mức thấp nhất trong ngành;

  • Thứ hai là tỷ trọng khách hàng đầu bảng giá trị cao liên tục tăng lên. Tỷ lệ giữ chân và độ sâu gọi của các khách hàng này cao hơn rõ rệt so với mức trung bình của ngành;

  • Thứ ba là hiệu ứng sàng lọc tích cực do tăng giá—giá cao hơn sàng lọc ra những khách hàng coi trọng hiệu quả nhiều hơn và có năng lực chi trả mạnh hơn. Giá trị thương mại của nhóm khách hàng này lớn hơn rất nhiều so với nhóm khách hàng giá trị thấp nhạy cảm với giá.

Quan trọng hơn, dựa trên đà tăng trưởng mạnh mẽ hiện tại của mảng kinh doanh MaaS; điều này có nghĩa là flywheel MaaS của Zhipu không chỉ đã quay rồi, mà còn đang tiếp tục tăng tốc.

Từ phòng thí nghiệm Thanh Hoa đến nhóm đầu tiên toàn cầu

Zhipu có thể đi ngược chiến tranh giá để tăng giá, có thể chạy thông flywheel MaaS—nguồn lực nền tảng ở tầng đáy, không bao giờ đến từ marketing và vận hành, mà luôn là thực lực công nghệ.

Nhiều người đều biết, điểm khởi đầu của Zhipu là đội ngũ công nghệ từ Đại học Thanh Hoa. Ngay từ lúc thành lập, Zhipu không đi theo lối kiến trúc tự hồi quy kiểu GPT làm theo trào lưu trong ngành; mà kiên trì đi theo hướng sáng tạo riêng, xây dựng kiến trúc độc đáo kết hợp mã hóa hai chiều GLM + hòa trộn tự hồi quy. Nhờ đó, từ bẩm sinh đã có lợi thế về hiểu văn bản dài, ảo giác thấp, logic mạnh, đặt nền tảng vững chắc cho các vòng lặp cải tiến công nghệ sau này.

Năm 2022, Zhipu đã mã nguồn mở mô hình GLM-130B với quy mô hàng tỷ tham số, trở thành sản phẩm duy nhất ở châu Á được chọn trong các cuộc đánh giá mô hình LLM chủ đạo toàn cầu của Stanford. Đồng thời, thông qua kỹ thuật lượng tử hóa, mô hình chạy mượt trên card đồ họa cấp tiêu dùng, qua đó một lần đặt nền tảng cho vị thế cốt lõi của hệ sinh thái mô hình LLM mã nguồn mở trong nước.

Từ thời điểm đó, Zhipu đã khắc sâu “tự nghiên cứu công nghệ” vào trong cốt lõi, hoàn thành khả năng tự chủ và kiểm soát được đối với các công nghệ nòng cốt toàn chuỗi, thực hiện khả năng thích ứng full-stack với chip nội địa, từ tầng đáy xây chắc nền móng cho an toàn công nghệ và tối ưu chi phí.

Trong ngành LLM, có một chân lý không thể lay chuyển: trần nhà thương mại luôn do giới hạn năng lực của mô hình quyết định.

Anthropic có thể đạt mức tăng trưởng doanh thu gấp 12 lần trong một năm—cốt lõi là năng lực của dòng mô hình Claude liên tục tiến sát, thậm chí một phần vượt qua GPT; còn Zhipu có thể giành vị trí số 1 về doanh thu LLM trong nước—cũng cốt lõi là năng lực của dòng mô hình GLM, hiện đã vững vàng đứng trong nhóm đầu tiên toàn cầu.

Trong năm qua, Zhipu đã hoàn thành quá trình lặp nhanh từ GLM-4.5 lên GLM-4.6, GLM-4.7 rồi đến GLM-5, GLM-5-Turbo, duy trì nhịp độ hàng đầu của ngành là nâng cấp mô hình nền mỗi 1-2 tháng một lần.

Quan trọng hơn, Zhipu đã hoàn thành sự chuyển đổi căn bản từ hướng dẫn theo tri thức sang hướng theo nhiệm vụ, biến GLM thành một tác nhân AI có thể tự độc lập hoàn thành các nhiệm vụ phức tạp.

Cốt lõi của chuyển đổi này chính là bước đột phá về năng lực AI Coding.

Đối với LLM, năng lực lập trình là nền tảng của năng lực cho mọi nhiệm vụ phức tạp—nếu viết code tốt, nghĩa là mô hình sở hữu năng lực logic mạnh, kế hoạch mạnh, gọi công cụ mạnh; có thể chia nhỏ nhu cầu phức tạp thành các bước có thể thực thi, cuối cùng bàn giao ra kết quả có thể hiện thực.

Và bối cảnh Coding cũng là một trong những bối cảnh thương mại hóa trưởng thành nhất hiện nay, nơi mức sẵn sàng chi trả là mạnh nhất. Toàn bộ doanh thu của Anthropic, 70%-75% đến từ các lượt gọi liên quan đến tạo mã code.

Zhipu nắm bắt chính xác “mảnh nền” cốt lõi đó.

Mô hình GLM-5 được công bố vào tháng 2/2026 còn thực hiện một bước nâng cấp nhảy vọt từ Vibe Coding sang Agentic Engineering.

Trong các bài kiểm tra chuẩn lập trình có uy tín trên toàn cầu, GLM-5 đạt 77,8 điểm ở SWE-bench-Verified và 56,2 điểm ở Terminal Bench2.0, đứng vững ở vị trí số 1 trong các mô hình mã nguồn mở. Trải nghiệm sử dụng thực tế đã tiến sát mô hình flagship của Anthropic là Claude Opus 4.5.

Trong bảng xếp hạng Artificial Analysis có uy tín toàn cầu, GLM-5 đứng thứ 4 toàn cầu và đứng đầu mã nguồn mở, chỉ sau GPT, Claude và Gemini, vững vàng bước vào nhóm đầu tiên của AI toàn cầu.

Điều đáng mong đợi hơn nữa là Zhipu sắp ra mắt GLM-5.1.

Đồng thời đề xuất năng lực kiến trúc Token (TAC)

Báo cáo tài chính này không chỉ là thành tích đầu tiên sau khi Zhipu lên sàn, mà còn là một lần tái cấu trúc toàn diện của chính Zhipu. Nó dùng dữ liệu thực sự để khiến cả ngành nhận thức lại về Zhipu, đồng thời cũng định nghĩa lại tiêu chuẩn đo giá trị của LLM.

Trong vài năm qua, toàn ngành LLM rơi vào một hiểu lầm lớn: ai cũng đem so xem tham số ai lớn hơn, chạy benchmark ai cao hơn, ai giá thấp hơn, nhưng rất ít người đi suy nghĩ xem giá trị cốt lõi của LLM rốt cuộc là gì.

Dù benchmark có cao đến đâu, nếu không thể triển khai vào kịch bản thực tế, không thể giúp doanh nghiệp và cá nhân tạo ra giá trị kinh tế “tiền thật”, thì cũng không có ý nghĩa.

Chính dựa trên phán đoán đó, trong báo cáo tài chính này lần đầu tiên Zhipu đề xuất khái niệm Token Architect Capability (viết tắt TAC), đưa ra một khung đo lường giá trị AI ba chiều có thể định lượng:

TAC = Số lượng trí tuệ gọi (gọi thông minh) × Chất lượng trí tuệ × Hiệu suất chuyển thành giá trị kinh tế

  • Lượng: mỗi ngày doanh nghiệp và cá nhân sẵn sàng gọi bao nhiêu Token, sẵn sàng giao cho AI xử lý bao nhiêu nhiệm vụ, khối lượng công việc lớn đến mức nào;

  • Chất: các Token này có đến từ mô hình đủ thông minh và đáng tin cậy không, có thể ổn định đưa ra kết quả có thể bàn giao trong các nhiệm vụ phức tạp hay không;

  • Hiệu suất: các nhiệm vụ mà AI xử lý có thực sự chuyển thành đầu ra kinh tế có thể đo lường được, hiện thực hạ chi phí tăng hiệu quả hay không.

Zhipu cho rằng, năng lực cạnh tranh cốt lõi của tổ chức và cá nhân trong tương lai ngày càng phụ thuộc vào mức TAC.

Còn Zhipu muốn làm—từ trước tới nay không chỉ là một nhà sản xuất mô hình bán Token—mà là hạ tầng cơ bản để nâng cao năng lực TAC của toàn xã hội, cung cấp cho từng doanh nghiệp, từng nhà phát triển, từng cá nhân một nền tảng năng lực để chuyển trí tuệ thành các thành quả kinh tế có thể bàn giao.

Việc đưa ra khái niệm này đánh dấu việc ngành LLM Trung Quốc chính thức bước vào một giai đoạn hoàn toàn mới của cạnh tranh kiến trúc thông minh: từ cuộc “đua tham số”, “cuộn benchmark”, và bùn lầy của cuộc chiến giá.

Trước đây, khi đánh giá một công ty LLM, người ta nhìn xem tham số của họ lớn đến đâu, gọi vốn được bao nhiêu; còn trong tương lai, khi đánh giá một công ty LLM, người ta sẽ nhìn xem họ có thể giúp khách hàng nâng TAC được bao nhiêu, và giúp khách hàng chuyển trí tuệ thành bao nhiêu giá trị kinh tế thực sự.

Và báo cáo tài chính của Zhipu chính là lời ghi chú tốt nhất cho thời đại mới này.

Khi toàn ngành đều dựa vào đốt tiền để lấy quy mô, dựa vào giá thấp để đổi lấy lưu lượng, thì Zhipu đã đi ra một vòng khép kín thương mại lành mạnh: đột phá công nghệ → hiệu quả vượt trội → quyền định giá → doanh thu theo quy mô → lợi nhuận → lại đầu tư cho công nghệ.

Nó dùng báo cáo tài chính này để chứng minh rằng LLM là một công việc làm ăn tốt có thể thực sự tạo ra giá trị và đạt lợi nhuận; các nhà sản xuất LLM tại Trung Quốc cũng có thể đi ra một con đường của riêng mình, cạnh tranh sòng phẳng trên cùng sân khấu với các người chơi đẳng cấp toàn cầu.

Nửa chặng đường sau của ngành LLM Trung Quốc cuối cùng cũng đã quay trở lại con đường đúng đắn về công nghệ và thương mại, thoát khỏi sự ồn ào của chiến tranh giá.

Nguồn bài viết: Quantum Finance

Lưu ý rủi ro và điều khoản miễn trừ trách nhiệm

        Thị trường có rủi ro, đầu tư cần thận trọng. Bài viết này không cấu thành lời khuyên đầu tư cá nhân và cũng không xem xét các mục tiêu đầu tư đặc biệt, tình hình tài chính hoặc nhu cầu riêng của từng người dùng. Người dùng cần cân nhắc liệu mọi ý kiến, quan điểm hoặc kết luận trong bài viết này có phù hợp với hoàn cảnh cụ thể của mình hay không. Căn cứ vào việc đầu tư như vậy, trách nhiệm thuộc về bạn.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim