Thật sự nên định giá DeepSeek như thế nào

Hỏi AI · DeepSeek định giá tăng gấp năm lần trong ba tuần có nguyên nhân sâu xa gì?

Tác giả|Vương Triệu Dương
Email|wangzhaoyang@pingwest.com

Trong vòng ba tuần, trong các báo cáo công khai, định giá của DeepSeek đã được chỉnh sửa bốn lần:

Đầu tháng 4 khoảng 10 tỷ USD “khởi động huy động vốn”, ngày 22 tháng 4 báo cáo cho biết định giá vượt quá 20 tỷ USD, ngày 6 tháng 5 truyền tin về việc “quỹ lớn” đàm phán dẫn đầu, định giá khoảng 45 tỷ USD, còn tuần trước, định giá tối đa mới nhất là trên 50 tỷ USD — nếu thành sự thật, đây sẽ là vòng gọi vốn đơn lẻ lớn nhất trong lịch sử các công ty AI Trung Quốc.

Và theo báo cáo, trong vòng huy động vốn này, tấm séc lớn nhất không đến từ các VC hay các ông lớn internet, mà chính là từ người sáng lập DeepSeek, Liang Wengfeng: cá nhân ông có thể bỏ ra tối đa 20 tỷ nhân dân tệ, chiếm 40% tổng số vốn huy động, theo lời đồn, ông đã tăng vốn trực tiếp từ 1% lên 34%, cộng với cổ phần gián tiếp, tổng cộng kiểm soát khoảng 84.29% cổ phần.

Và quỹ “quỹ lớn” — tên đầy đủ là Quỹ Đầu tư Ngành Công nghiệp Mạch tích hợp Quốc gia — đã từng đầu tư vào các trung tâm bán dẫn chủ chốt như SMIC, Yangtze Memory, trước đây chưa từng công khai đầu tư vào các nhà sản xuất mô hình ngôn ngữ lớn, một khi vòng huy động này thành công, cũng sẽ là lần đầu tiên.

DeepSeek trước đây nổi bật với các đặc điểm không huy động vốn, không thương mại hóa, không trình diễn dự án, vì công ty mẹ là Fantasia Quantitative luôn có đủ nguồn vốn dự trữ. Về mặt thương mại hóa, họ gần như không có hành động chủ động nào, điều này khiến định giá cao so với các công ty mô hình khác, dù tỷ lệ “kỳ vọng thị trường” đã khá cao, vẫn còn gây ngạc nhiên.

Khi bạn đặt những sự kiện này cùng nhau, sẽ phát hiện rằng không thể giải thích bằng khung mô hình công ty mô hình lần này — tại sao định giá lại tăng gấp năm lần trong ba tuần? Tại sao quỹ lớn lại tham gia? Tại sao chính người sáng lập bỏ ra số tiền lớn nhất?

Vòng huy động này cần một khung lý thuyết khác để hiểu rõ hơn.

DeepSeek không phải là một “công ty mô hình tốt hơn” nữa, nó giống như một công ty hạ tầng cơ bản trông giống như công ty mô hình. Vị trí này đã thể hiện rõ trong vòng huy động lần này.

1

1

Khi Liang Wengfeng nói về huy động vốn năm 2024, ông từng nói: “Vấn đề của chúng tôi chưa bao giờ là tiền, mà là chip cao cấp bị cấm vận.”

Chủ đề cốt lõi của các công ty mô hình là dữ liệu, thuật toán, nhân tài, còn chip là chi phí, không phải chiến lược. Nói chip là vấn đề cốt lõi, có nghĩa là từ ngày đầu, DeepSeek ngoài việc nghĩ “làm thế nào để mô hình tốt hơn”, còn chú ý nhiều hơn đến “làm thế nào để tái xây dựng một hệ thống có thể chạy được trong điều kiện hạn chế về năng lực tính toán”.

Nếu xem xét lại tất cả các đổi mới công nghệ quan trọng nhất của DeepSeek, từ MLA đến MoE, từ huấn luyện FP8 đến tối ưu suy luận cực đại, về bản chất đều là các cách giải khác nhau của cùng một vấn đề: làm thế nào để dùng ít hơn, bị hạn chế hơn về năng lực tính toán, tạo ra mô hình đỉnh cao. Điều này đã chuyển từ cách suy nghĩ của một công ty mô hình sang logic phát triển của một công ty hạ tầng.

Nếu DeepSeek không phải là công ty mô hình, thì nên định giá nó thế nào? Tham khảo ai? Đáp án không phải Kimi, không phải Zhihui, không phải MiniMax. Cấu trúc huy động vốn lần này có thể cung cấp hướng suy nghĩ.

1

2

Ngày 24 tháng 4, DeepSeek-V4 ra mắt, báo cáo kỹ thuật lần đầu tiên đưa Huawei Ascend NPU và Nvidia GPU vào danh sách xác minh phần cứng — “Chúng tôi đã xác minh giải pháp EP chi tiết trên hai nền tảng Nvidia GPU và Huawei Ascend NPU”, các mô hình có quy mô hàng nghìn tỷ tham số, lần đầu tiên trong tài liệu chính thức xác nhận chính thức về chip AI nội địa, ngày phát hành, 8 nhà cung cấp chip nội địa như Huawei Ascend, Cambrian đã hoàn thành thích ứng, phá vỡ quy trình cần nhiều tháng điều chỉnh trước đây, và để có dòng chữ này, nhóm DeepSeek đã hợp tác chặt chẽ với Huawei và Cambrian trong nhiều tháng, một số báo cáo cho rằng đây cũng là lý do họ hoãn kế hoạch ra mắt. Họ đã thực hiện nhiều điều chỉnh và viết lại phần nền của mô hình.

Trong khi đó, vòng huy động vốn bắt đầu trong thời gian này: thời điểm rất thú vị, các công ty khác huy động vốn để đạt được mục tiêu nào đó, còn DeepSeek huy động vốn vì đã làm được một việc, và làm theo cách có thể xác minh công khai, tương đương với Liang Wengfeng chỉ cần phát hành một mô hình đã hoàn thành, là đã hoàn tất các thủ tục thẩm định thường phải qua nhiều cuộc họp.

Trong các vòng huy động tiếp theo, thực ra có ba khoản tiền, ba logic khác nhau, không chồng chéo nhau.

Quỹ lớn — tên đầy đủ là Quỹ Đầu tư Ngành Công nghiệp Mạch tích hợp Quốc gia, nguồn vốn công nghiệp quốc gia quan trọng nhất trong ngành bán dẫn — các đối tượng đầu tư trong quá khứ là SMIC, Yangtze Memory, đầu tư vào hạ tầng bán dẫn “không thể thiếu” của Trung Quốc. Nhiệm vụ của quỹ lớn là bổ sung các thiếu hụt về phần cứng trong sản xuất bán dẫn, thiết bị và vật liệu, các công ty mô hình lớn trước đây chưa từng nằm trong phạm vi đầu tư của họ.

Lý do họ từng e ngại đầu tư vào các công ty mô hình là vì chu kỳ lợi nhuận thương mại của mô hình không rõ ràng, dùng logic đầu tư vào bán dẫn để đầu tư vào mô hình là không phù hợp. Nhưng giờ đây, DeepSeek đã giải quyết vấn đề này bằng một hành động: V4 dùng chip nội địa để thích ứng, chứng minh rằng nó không chỉ là một công ty mô hình, quỹ lớn giờ đây có thể dùng một ngôn ngữ khác để mô tả khoản đầu tư này, đó là đầu tư vào khả năng vận hành của hệ sinh thái tính toán nội địa, xem xét chiến lược dùng mô hình hàng đầu để thúc đẩy ứng dụng của tính toán nội địa, xây dựng vòng khép kín “chip nội địa + mô hình nội địa” — việc này trong logic của họ, giống như đầu tư vào SMIC, đều là các vấn đề cùng loại.

Phần còn lại của các nhà đầu tư công nghiệp như Tencent, theo đồn đoán, là phần mang động cơ khác: đảm bảo không bị loại khỏi hạ tầng AI nội địa của Trung Quốc, vì nếu DeepSeek cuối cùng trở thành nền tảng, thì không nằm trong cấu trúc cổ phần đồng nghĩa với chỉ là khách hàng trả phí, còn mang lại không chỉ là tiền, mà còn là cổng sinh thái, khách hàng doanh nghiệp, tài nguyên đám mây — đúng là điểm yếu nhất của DeepSeek về mặt thương mại hóa.

Điều này cũng giải thích lý do tại sao các ông lớn khác có tham vọng hạ tầng, có thể cuối cùng không đầu tư cổ phần. DeepSeek đã được xem là đối thủ cạnh tranh tiềm năng về hạ tầng, chứ không chỉ là một công ty mô hình có thể nhận cổ phần.

1

3

Điều này dẫn đến cảm giác “chia rẽ”: một bên khóa chặt vốn chiến lược quốc gia, xác nhận vị trí hạ tầng; một bên thu hút vốn từ các quỹ công nghiệp, mở ra cổng thương mại — hai điều này trong nhiều trường hợp sẽ mâu thuẫn, nhưng qua cấu trúc huy động lần này, DeepSeek cố gắng để chúng vận hành hoàn toàn độc lập, không gây ảnh hưởng lẫn nhau.

Nói cách khác, sau khi DeepSeek huy động vốn, tiến trình thương mại hóa nhanh chậm không liên quan gì đến câu chuyện lớn hơn.

Phần của quỹ lớn — tương ứng với các mục tiêu dài hạn như tự chủ năng lực tính toán, hệ sinh thái chip nội địa, thời gian dự kiến là năm, mười năm, không cần lợi nhuận theo quý; còn phần của Tencent và các quỹ công nghiệp khác là một dòng khác, nhịp độ thương mại hóa theo các công ty mô hình khác.

Trong khi mọi người bàn về khó khăn thương mại của DeepSeek, dường như luôn bỏ qua một số thực tế: giá API của DeepSeek đã phá vỡ giới hạn ngành — V4-Flash cache hit input chỉ còn 0.02 nhân dân tệ/triệu từ, tổng chi phí chỉ khoảng 1% của GPT-5.5, chi phí suy luận đã bị đẩy xuống mức này, giúp DeepSeek đảm bảo rằng kinh doanh API của họ không lỗ; còn trong báo cáo “Top 100 Ứng dụng AI Gen tiêu dùng” mới nhất của a16z, DeepSeek vẫn là sản phẩm phân bố người dùng Trung-Mỹ — lưu lượng web phân bổ ở Trung Quốc (33.5%), Mỹ (6.6%), ngay cả khi cập nhật mô hình “kéo theo” việc ứng dụng, người dùng di động vẫn giữ vững, không sụp đổ như nhiều người nghĩ. Điều này có nghĩa là, về lý thuyết, các công ty mô hình khác có thể kiếm tiền theo cách của họ, và chi phí biên còn thấp hơn.

Thực ra, sự chia rẽ này là đặc điểm lớn nhất của DeepSeek, là do chính họ chủ động thiết kế, và đã tồn tại từ thời Fantasia.

Fantasia kiếm tiền, DeepSeek làm nghiên cứu, đó là cấu trúc vận hành từ ngày đầu. Fantasia không cần DeepSeek mang lại lợi nhuận thương mại, DeepSeek không cần chứng minh tăng trưởng ARR cho Fantasia — mối quan hệ này, người ngoài khó có thể tìm ra tham chiếu, gần như là một công ty giao dịch tự quản quyết định bỏ lợi nhuận vào nghiên cứu cơ bản: nghiên cứu là một phần trong lý do tồn tại của họ, không phải dự án chờ biến thành lợi nhuận.

Sự chia rẽ này dựa trên việc Liang Wengfeng cùng lúc nắm giữ hai phía, nhưng càng về sau, càng dễ trở nên mong manh, vì nó mang tính cá nhân, không mang tính cấu trúc — một khi vốn bên ngoài vào, rủi ro mất cân bằng lần đầu tiên thực sự tồn tại.

Vì vậy, vòng huy động này thực ra là lần đầu tiên biến sự phụ thuộc vào ý chí cá nhân này thành cấu trúc cổ phần cố định. Mối quan hệ giữa Fantasia và DeepSeek, đã được nhân rộng ra quy mô lớn hơn: Fantasia là cấp độ đầu tiên của sự chia rẽ, bên trong DeepSeek, thương mại hóa và nghiên cứu hạ tầng tính toán là cấp độ thứ hai, hai cấp độ này đều có cùng một logic và cùng một người thiết kế.

Do đó, trong vòng huy động này, ngoài hai khoản tiền đó, điểm đặc biệt hơn chính là khoản thứ ba, chính là khoản tiền của Liang Wengfeng.

Báo cáo nói rằng, Liang Wengfeng cá nhân bỏ ra tối đa 20 tỷ nhân dân tệ, khoảng 2.8 tỷ USD. So với vòng huy động của Kimi mới hoàn thành, tổng khoảng 2 tỷ USD — tức là, số tiền mà Liang Wengfeng bỏ ra đủ để phù hợp với hầu hết các vòng gọi vốn của các công ty mô hình đơn lẻ.

Vì vậy, phần 60% còn lại từ bên ngoài không phải để giúp DeepSeek tồn tại như một công ty mô hình hay “tiếp tục huấn luyện mô hình”, tiền của Fantasia đã đủ, tiền của Liang Wengfeng cũng đủ. Mỗi nhà đầu tư bên ngoài tham gia đều vì DeepSeek không còn chỉ là một công ty mô hình nữa.

Và khoản tiền cá nhân này mua quyền khóa cấu trúc toàn bộ, bất kể bao nhiêu vốn bên ngoài được đưa vào, quyết định cốt lõi sẽ không bị pha loãng.

1

4

Ngoài ra, vòng huy động này trước đó bị cho là nguyên nhân lớn nhất do mất nhân tài. Nhưng sau khi xem xét kỹ, sẽ thấy tình hình mất nhân tài của họ có thể đã bị phóng đại.

Người rời đi thực sự quan trọng — Vương Bỉnh Xuân sang Tencent, Guo Daya sang ByteDance Seed, Luo Fuli được mời đến Xiaomi với mức lương hàng chục triệu, Nguyễn Chung gia nhập Yuanrong Qixing, bao gồm các kỹ thuật cốt lõi như mô hình nền, suy luận, OCR, đa phương thức.

Nhưng theo dữ liệu rất chi tiết mới nhất của 《Tài chính》, trong 15 người xuất hiện nhiều nhất trong 27 bài báo, chỉ có 2 người rời đi, khi DeepSeek-LLM ra mắt, còn 71 trong số 86 người vẫn xuất hiện trong danh sách tác giả V4, 300 người rời đi trong 10 nhóm, tỷ lệ rời đi chỉ 3.3% — những người quan tâm đến cạnh tranh nhân lực trong các công ty AI sẽ biết con số này thấp đến mức nào.

Định giá quyền chọn để giữ chân nhân tài có giá trị thực, nhưng đó là vấn đề đi kèm trong huy động vốn, làm đúng các mục tiêu dài hạn, thậm chí việc giữ chân nhân tài cũng tự nhiên được giải quyết — đây chính là logic chung để hiểu các quyết định của DeepSeek: họ không hành động chỉ để giải quyết vấn đề trước mắt, nhưng khi mục tiêu dài hạn thành công, các vấn đề trước mắt thường cũng sẽ tự nhiên biến mất.

1

5

Cuối cùng, để hiểu rõ hơn về logic huy động vốn và định giá của họ, còn một chủ đề quan trọng nữa là: Đối thủ cạnh tranh của DeepSeek là ai?

Nvidia đã định hình quy tắc chơi của năng lực tính toán trong kỷ nguyên AI, tất cả các công ty mô hình — dù Trung Quốc hay Mỹ — đều sống trong giới hạn này, còn DeepSeek là một công ty cố gắng định lại giới hạn đó, khoảnh khắc V4 Ascend thích ứng thành công là lần đầu tiên xác nhận điều này. DeepSeek đặc biệt quan tâm đến Nvidia.

Định giá 50 tỷ USD không dựa trên năng lực mô hình hiện tại, không dựa trên ARR, không dựa trên quy mô người dùng. Các công ty mô hình có thể so sánh toàn cầu: Kimi mới hoàn thành vòng huy động, định giá sau khi đầu tư khoảng 20 tỷ USD, tăng gấp gần bốn lần trong nửa năm, có hỗ trợ từ ARR thực tế; Anthropic vòng trước định giá 380 tỷ USD, doanh thu hàng năm dự kiến vượt 30 tỷ USD vào đầu năm 2026. DeepSeek gần như chưa có doanh thu thương mại, định giá vượt gấp đôi Kimi — và phần lớn trong số này đến từ quỹ quốc gia bán dẫn, không phải các VC kỳ vọng vào tăng trưởng ARR trong tương lai của mô hình.

Chính cấu trúc nhà đầu tư đã cho thấy, chênh lệch giá này không phải dựa trên kỳ vọng thương mại, mà là phần thưởng cho hạ tầng.

Nếu DeepSeek thành công trong việc thực hiện mục tiêu của mình — một hệ thống AI tiên tiến không phụ thuộc Nvidia, dựa trên mã nguồn mở của hạ tầng AI Trung Quốc — thì đối tượng so sánh có thể là một vị trí nằm giữa OpenAI phiên bản Stargate và Nvidia, hiện chưa được định nghĩa rõ: vừa phát triển mô hình đỉnh cao, vừa cố gắng dùng phương pháp mới để giải quyết vấn đề hạ tầng tính toán, không có công ty nào khác trên thế giới có thể so sánh.

Từ vị trí này, 50 tỷ USD vẫn là kỷ lục, nhưng vẫn còn rẻ.

Vòng huy động này định giá một điều chưa xảy ra. Điều này phụ thuộc vào việc Liang Wengfeng có thể làm được điều ông đã theo đuổi từ ngày đầu hay không, và toàn bộ con đường từ Fantasia đến DeepSeek, ông là người cực kỳ kiên trì theo đuổi chủ nghĩa dài hạn, làm đúng và dài hạn, nhiều thứ sẽ tự nhiên giải quyết trong quá trình. Vòng huy động này có thể là lần đầu tiên ông để thế giới bên ngoài thấy rõ toàn bộ bức tranh này.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim