DeepSeek V4 sau vài ngày ra mắt, phía Silicon Valley liên tục sôi động, cũng đã dẫn đến một số vấn đề tranh luận sắc bén hơn: hiệu quả mô hình, cấu trúc chip, thời điểm IPO, mở nguồn gây áp lực cho các mô hình đóng nguồn.

Ngày 29 tháng 4, từ vlog của Silicon Valley 101, mời kiến trúc sư chip Xiao Zhibin và cựu nghiên cứu viên OpenAI Jenny Xiao, hai người trò chuyện hơn một giờ đồng hồ, thấu hiểu toàn bộ câu chuyện.

Bị mở nguồn vượt qua, giá trị thương mại của bạn về 0

Trong cuộc đối thoại, câu nói cay đắng nhất là khái niệm Jenny đã đề xuất từ năm ngoái — kill line (đường chết), mô hình mở nguồn vẽ đường chết cho các công ty mô hình nền đóng nguồn.

"Nếu bạn là một công ty mô hình nền và bị mở nguồn vượt mặt, giá trị kinh doanh của bạn về cơ bản là không còn."

Nếu bạn là một công ty mô hình nền, bị mở nguồn vượt qua, giá trị thương mại của bạn sẽ về 0.

Đây không phải là cạnh tranh kỹ thuật, đây là giới hạn sinh tử.

Jenny lấy ví dụ của Anthropic: nếu một ngày nào đó Claude không còn là mô hình lập trình tốt nhất, ai còn dùng Claude Code nữa?

Theo logic này, ngày 24 tháng 4, khi DeepSeek V4 ra mắt, tất cả các cổ phiếu và định giá của các công ty đóng nguồn ở Silicon Valley đều đối mặt với một câu hỏi tâm linh: Mô hình của bạn, bây giờ còn đáng bán với giá này không?

Nói về giá cả là trực diện nhất:

GPT-5.5 đắt hơn GPT-5.4 đúng 2 lần, phiên bản Pro cho văn bản dài mỗi triệu token 180 USD.

Cùng ngày, DeepSeek V4 ra mắt. Nhập 1 nhân dân tệ/triệu token, xuất 24 nhân dân tệ/triệu token. Phiên bản Flash còn khắc nghiệt hơn: nhập 0.2 nhân dân tệ/triệu token, xuất 2 nhân dân tệ/triệu token.

Một cái đắt gấp đôi, một cái rẻ gấp mười lần.

Định giá các công ty mô hình nền cơ bản là hai cực — bạn tồn tại là vì mô hình mạnh nhất. Một khi không còn mạnh nhất, định giá sẽ về 0. Dù bạn tên là OpenAI.

Tiền nhiều quá, ngược lại không tiết kiệm

Jenny trong cuộc trò chuyện đã vạch trần một sự thật mà Silicon Valley không dám đối mặt:

"Các công ty Silicon Valley có quá nhiều tiền, thậm chí không có động lực tối ưu hóa hiệu quả. Các nhà sản xuất mô hình Trung Quốc bị ép buộc về nguồn lực, sớm hơn trong đổi mới hiệu quả token."

Hạn chế về nguồn lực, lại trở thành chất xúc tác cho đổi mới.

OpenAI từ ngày đầu đã tin vào "move fast, break things", mua GPU thoải mái, xây dựng hạ tầng điên cuồng. Trong khi đó, Anthropic lại kiềm chế, sợ doanh thu không theo kịp, bị chi phí mua sắm kéo xuống.

Kết quả là gì? Trong cùng một mức doanh thu, Hiệu quả vốn của Anthropic rõ ràng cao hơn OpenAI.

Thêm vào đó, OpenAI đồng thời chiến đấu trên nhiều mặt trận: phần cứng, tự nghiên cứu chip, ứng dụng mua sắm, trong khi trải nghiệm ChatGPT cốt lõi lại chưa tốt. Từ cuối năm ngoái, nhiều dự án phụ bị cắt bỏ, Sora cũng nằm trong số đó.

Tinh thần các nhà đầu tư hoàn toàn thay đổi. Trước đây, nhìn các công ty AI là "đường cong vẫn đang tăng theo cấp số nhân, tiếp tục bỏ tiền vào". Giờ đây, câu hỏi đặt ra là:

"Tiếp tục bỏ 1 tỷ, 10 tỷ, lợi ích biên ở đâu? ROI ở đâu?"

DeepSeek đưa ra câu trả lời rất rõ ràng: tiếp tục mở rộng ROI của hạ tầng có thể đã không còn khả thi.

Đổi mới đều là bị ép buộc. Tiền rẻ vốn đã là tiền đề của cuộc cách mạng công nghệ.

Mỗi cuộc cách mạng công nghiệp, thúc đẩy sự thay đổi không chỉ là công nghệ có xuất sắc đến đâu, mà còn là công nghệ rẻ đến mức nào. Chỉ khi công nghệ đủ rẻ để người bình thường dùng được, thì công nghệ mới thực sự thay đổi thế giới.

Không có hiệu quả, AGI chỉ là một bản trình diễn

Xiao Zhibin sau khi đọc xong luận án V4 nhận định: "Hướng đi nằm trong dự đoán, hoàn thiện kỹ thuật lại bất ngờ."

Tất cả các tối ưu kỹ thuật của V4 thực ra đều nhắm vào cùng một mục tiêu — hiệu quả token (token efficiency).

Nó dùng ba "dao":

• Tối ưu Muon: Thay thế một phần các mô-đun huấn luyện truyền thống Adam, tăng tốc độ hội tụ hơn nữa

Ba điều này hợp lại, đều hướng tới một kết quả: Chi phí sinh ra mỗi token thấp hơn, mỗi lần suy luận tiêu tốn ít bộ nhớ hơn.

Chi phí tính toán giảm xuống còn 1/3 của các mô hình Silicon Valley, bộ nhớ tiêu thụ chỉ còn 1/10.

Nhưng điểm khiến V4 thực sự đáng sợ, không chỉ đơn thuần là "tiết kiệm tiền".

Jenny liên tục nhắc nhở trong cuộc trò chuyện: Trong thời đại Chatbot, token tiêu thụ có giới hạn, mô hình đắt hơn người dùng cũng có thể chịu đựng. Nhưng Thời đại Agent hoàn toàn là một logic khác — phân chia nhiệm vụ dài, gọi nhiều công cụ, phản tư và lập kế hoạch liên tục, token tiêu thụ gấp 10 đến 100 lần chatbot.

Nếu mỗi token đều có giá trị không nhỏ, mô hình sẽ không thể suy nghĩ sâu dài hạn, càng không thể phục vụ người dùng quy mô lớn.

Vì vậy, cô đã đưa ra câu nói định hướng:

Không có hiệu quả, AGI chỉ là một bản demo. Có hiệu quả, AGI mới trở thành sản phẩm thực sự.

Trong thời đại Agent, hiệu quả chính là một phần của trí tuệ.

Tại sao Anthropic có thể vượt lên thành 1 nghìn tỷ? Tập trung > làm mọi thứ

Gần đây, định giá của Anthropic vượt qua OpenAI, vọt lên 1 nghìn tỷ USD.

Jenny liệt kê ba lý do, nhưng về bản chất chỉ có năm chữ: Tập trung > làm mọi thứ.

Thứ nhất, Claude Code.

Tại sao Claude Code lại là "thời khắc định mệnh" của Anthropic?

Mô hình của Anthropic luôn rất tốt, nhưng Claude Code mới là sản phẩm thực sự thúc đẩy doanh thu. Peter Steinberger, sáng lập OpenClaw, đã viết một bài: "Claude Code chính là máy tính của tôi."

Một khi mô hình có thể viết mã, nó có thể thực hiện các nhiệm vụ chung — cập nhật CRM, chuyển tiếp email, tự động hóa quy trình, tất cả đều dựa trên mã.

Jenny nhận định rất sắc bén: Lập trình là bước quan trọng nhất để tiến tới AGI. Ai chiếm lĩnh lập trình, người đó có khả năng trở thành người dẫn đầu thời đại AGI.

Thứ hai, lòng tin doanh nghiệp.

Các khách hàng doanh nghiệp trong quỹ của Jenny liên tục nói cùng một câu: chọn Anthropic vì nó có cam kết an toàn. Thêm vào đó, vụ kiện của Anthropic chống lại Bộ Quốc phòng Mỹ đã gửi đi tín hiệu rõ ràng.

Thứ ba, không làm những việc thừa thãi.

OpenAI muốn làm "mọi thứ cho mọi người", kết quả là phân tán chiến tuyến, mất đi lợi thế kỹ thuật. Anthropic chỉ tập trung vào ba lĩnh vực: an toàn, doanh nghiệp, lập trình.

Các nhà đầu tư Silicon Valley tin một chân lý bất biến: Doanh thu doanh nghiệp ưu tiên hơn doanh thu tiêu dùng. Thu nhập của Anthropic chủ yếu tập trung vào doanh nghiệp, đúng là câu chuyện được giới đầu tư Mỹ yêu thích nhất.

Nvidia: An toàn ngắn hạn, thị trường suy luận dài hạn tất yếu phân hóa

Nói về chip, hiện tại mọi người đều nghĩ DeepSeek đang "phi Nvidia hóa".

Nhưng thực tế còn phân rõ hơn.

Giai đoạn huấn luyện: Việc huấn luyện trước quy mô lớn của DeepSeek V4 rõ ràng diễn ra trên các cụm Nvidia khổng lồ. Trang 16, 20 của báo cáo kỹ thuật V4 đề cập đến TCGenO5, cùng các toán tử then chốt như MegaMoE², đều là tối ưu sâu trong hệ sinh thái CUDA.

Giai đoạn thích nghi: Huawei Ascend tuyên truyền là "tối ưu thích nghi tiếp tục huấn luyện/ suy luận trong ngày 0", AMD thì "tối ưu tích hợp trên ROCm".

Chú ý một từ khóa quan trọng — "thích nghi".

Điều này có nghĩa là, mô hình đã được huấn luyện định hình trên cụm Nvidia. Ascend và AMD chỉ làm việc sau đó, dùng phần mềm của riêng họ để "kết nối" mô hình đã huấn luyện. Đây là tương thích ngược, không phải thay thế gốc.

Từ góc độ này, trong ngắn hạn, Nvidia vẫn giữ được rào cản cạnh tranh trong giai đoạn huấn luyện. Hệ sinh thái CUDA không phải ngày một ngày hai có thể chuyển đổi.

Nhưng về dài hạn? Thị trường suy luận thực sự đang có sự dịch chuyển.

Sau khi V4 giảm chi phí attention của dài và ngắn, rào cản suy luận quy mô lớn giảm rõ rệt. Suy luận không còn là "ai nhiều card hơn thắng", mà là "ai phù hợp kiến trúc hơn thắng". TPU của Google, AMD, các chip tự nghiên cứu của các nhà cung cấp đám mây, thậm chí sức mạnh tính toán nội địa, đều đang tìm cơ hội trong xu hướng này.

Dấu hiệu "80/20" khiến Silicon Valley mất ngủ

Trong danh mục đầu tư của Jenny có một dữ liệu: 80% nhiệm vụ chạy trên các mô hình mở nguồn trung bình và nhỏ. Chỉ 20% nhiệm vụ phức tạp nhất mới dùng mô hình đóng nguồn.

Cách đây một năm, không ai tin tỷ lệ này.

Giờ đây, Silicon Valley hàng ngày đều có thể thấy thông tin này: "Chúng tôi có 10 triệu USD cổ phiếu OpenAI, các quỹ của các ông có mua không? Hoặc biết ai mua không?"

Ngày 29 tháng 4, trong tập cuối của Silicon Valley 101, Jenny đã kết luận rõ ràng:

"DeepSeek như một khẩu súng đặt sau lưng các công ty mô hình ở Silicon Valley. Nếu các công ty này không chạy nhanh đủ, DeepSeek sẽ đuổi kịp, thậm chí phá hủy hoàn toàn hoạt động của họ."

Khẩu súng này đã lên đạn.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

Phần thưởng
Thích
Bình luận
Đăng lại
Retweed

Bình luận

Thêm một bình luận

Không có bình luận

Chủ đề thịnh hành
Xem thêm
#
GateCompletesDividendDistribution
197,77K Phổ biến
#
StrategyBuybackSurges12%
59,41K Phổ biến
#
IsraelStrikesIranBTCPlunges
67,01K Phổ biến
#
PredictWorldCupShare20000U
516,2K Phổ biến
#
TrumpDisclosesOver100MBTCETH
3,83M Phổ biến

Đã ghim

sơ đồ trang web

DeepSeek khẩu súng này đã chĩa vào sau đầu của Thung lũng Silicon

Bị mở nguồn vượt qua, giá trị thương mại của bạn về 0

Tiền nhiều quá, ngược lại không tiết kiệm

Không có hiệu quả, AGI chỉ là một bản trình diễn

Tại sao Anthropic có thể vượt lên thành 1 nghìn tỷ? Tập trung > làm mọi thứ

Nvidia: An toàn ngắn hạn, thị trường suy luận dài hạn tất yếu phân hóa

Dấu hiệu "80/20" khiến Silicon Valley mất ngủ

Chủ đề thịnh hành

GateCompletesDividendDistribution

StrategyBuybackSurges12%

IsraelStrikesIranBTCPlunges

PredictWorldCupShare20000U

TrumpDisclosesOver100MBTCETH

Đã ghim