SemiAnalysis: Từ cơ sở hạ tầng đến lớp mô hình, sự dịch chuyển tài sản trên chuỗi giá trị AI đang tăng tốc

Ngành công nghiệp AI đang chứng kiến sự dịch chuyển cấu trúc về trọng tâm giá trị.

Trong hai năm qua, NVIDIA, các nhà sản xuất bộ nhớ và nhà cung cấp năng lượng đã chi phối việc phân phối lợi nhuận đầu tư AI. Tuy nhiên, khi AI tác nhân (Agentic AI) thương mại hóa nhanh chóng, không gian lợi nhuận của tầng mô hình đang mở rộng với tốc độ chưa từng thấy, trong khi NVIDIA và TSMC, những bên kiểm soát nguồn cung cấp sức mạnh tính toán, vẫn chưa phản ánh đầy đủ xu hướng này vào định giá của mình.

Anthropic là minh chứng trực tiếp nhất cho sự chuyển đổi này. Theo nghiên cứu mới nhất của SemiAnalysis, doanh thu hàng năm (ARR) của Anthropic đã tăng từ 9 tỷ USD đầu năm lên hơn 44 tỷ USD, và tỷ suất lợi nhuận gộp của cơ sở hạ tầng suy luận của họ đã tăng từ 38% lên hơn 70% trong cùng kỳ. Đồng thời, chi phí sản xuất token đã giảm mạnh nhờ cải tiến phần cứng và tối ưu hóa phần mềm, khoảng cách giữa giá trị và chi phí ngày càng mở rộng, đưa các nhà sản xuất mô hình vào giai đoạn tăng trưởng lợi nhuận nhanh chóng.

Về phía cung, NVIDIA và TSMC sở hữu các tài nguyên khan hiếm nhất, nhưng vẫn chưa có phản ứng giá đầy đủ trước nhu cầu bùng nổ hiện tại. SemiAnalysis cho rằng sự chậm trễ trong định giá này tạo ra một sự lệch pha thị trường quan trọng: các hệ thống thế hệ mới như Vera Rubin (VR NVL72) có tiềm năng tăng giá đáng kể, và ai chiếm được lợi thế trong cuộc tái phân phối giá trị này sẽ ảnh hưởng sâu sắc đến logic đầu tư của các mắt xích trong chuỗi công nghiệp AI.

Lộ trình dịch chuyển của bể giá trị AI trong ba năm

Từ năm 2023 đến 2025, lợi nhuận vượt trội từ đầu tư AI chủ yếu tập trung ở tầng cơ sở hạ tầng.

NVIDIA công bố báo cáo tài chính bùng nổ lần đầu vào tháng 5 năm 2023, tăng 25% sau giờ giao dịch trong một ngày, chính thức mở ra làn sóng đầu tư AI. Năm 2024, Vistra và GE Vernova lần lượt tăng 265% và 146%, lọt vào nhóm cổ phiếu mạnh nhất S&P 500, và nút thắt năng lượng trở thành tâm điểm thị trường. Năm 2025, mảng bộ nhớ tiếp nối đà tăng, với SanDisk, Western Digital, Seagate và Micron đều ghi nhận mức tăng hơn 200% trong năm, mất cân bằng cung cầu bộ nhớ trở thành biến số cốt lõi thúc đẩy định giá.

Trong khi đó, tỷ suất lợi nhuận gộp của các nhà sản xuất mô hình và nhà cung cấp dịch vụ suy luận chịu áp lực kéo dài. Vào thời điểm đó, hiệu quả thực tế của AI bị chỉ trích chỉ là "phiên bản tốt hơn của Google Search" kèm giao diện trò chuyện, khác xa với kỳ vọng chi tiêu vốn hàng nghìn tỷ USD.

Cục diện này đã thay đổi căn bản vào cuối năm 2025.

AI tác nhân: Bước ngoặt tái định hình kinh tế token

SemiAnalysis coi tháng 12 năm 2025 là bước ngoặt thực sự của thương mại hóa AI – AI tác nhân bắt đầu hoạt động ổn định và triển khai quy mô lớn trong quy trình làm việc doanh nghiệp. Ý nghĩa cốt lõi của sự thay đổi này là nó thay đổi căn bản giá trị kinh tế của token.

Lấy SemiAnalysis làm ví dụ, chi tiêu token hàng năm của họ đã tương đương khoảng 30% tổng lương nhân viên, mỗi nhân viên tiêu thụ hơn 5 tỷ token mỗi tháng, gấp hơn 5 lần mức bình quân đầu người tại Meta. Nhóm nghiên cứu liệt kê nhiều trường hợp thực tế: các công việc như lập mô hình tài chính, tạo biểu đồ và phân tích lợi nhuận vốn cần một nhà phân tích cấp thấp trong nhiều giờ, nay có thể hoàn thành với chi phí token cực thấp thông qua AI tác nhân, trong khi chi phí nhân công tương đương từng lên tới hàng trăm đến hàng nghìn USD.

Đồng thời, chi phí sản xuất token đang giảm mạnh. SemiAnalysis ước tính, trong các tình huống tác vụ AI tác nhân, giá hỗn hợp thực tế khi chạy Opus 4.7 là khoảng 0,99 USD trên một triệu token, thấp hơn nhiều so với giá niêm yết chính thức 5 USD/25 USD – nguyên nhân là do khối lượng công việc của AI tác nhân có tỷ lệ đầu vào/đầu ra rất cao (khoảng 300:1) và tỷ lệ hit cache trên 90%, nhiều token rơi vào mức giá thấp nhất.

Tốc độ tăng tốc ở cấp độ phần cứng cũng đáng kể. So với H100 một năm trước, dòng Blackwell có thể tạo ra số token mỗi giây trong khối lượng công việc tiên tiến tăng khoảng 30 lần. So sánh thêm cho thấy, GB300 NVL72 được tối ưu hóa so với H100 được tối ưu hóa ở độ chính xác FP8 có thông lượng tăng khoảng 17 lần, chuyển sang FP4 khoảng cách này mở rộng lên 32 lần, trong khi tổng chi phí sở hữu (TCO) chỉ cao hơn khoảng 70%.

Khoảng cách hai chiều giữa giá trị và chi phí chính là động lực cốt lõi đưa tỷ suất lợi nhuận gộp của Anthropic từ 38% lên hơn 70%.

Quyền định giá tầng mô hình: Tại sao không bị cạnh tranh ăn mòn

Trước sự mở rộng nhanh chóng tỷ suất lợi nhuận của các nhà sản xuất mô hình, câu hỏi phổ biến nhất trên thị trường là: cạnh tranh cuối cùng sẽ hạ giá. SemiAnalysis có quan điểm bảo lưu về điều này và đưa ra hai luận điểm hỗ trợ.

Thứ nhất, quyền định giá của các mô hình đóng tiên tiến vẫn vững chắc. Mặc dù các bài kiểm tra chuẩn của mô hình nguồn mở liên tục được cập nhật, nhưng trong các tình huống công việc tri thức thực tế, hiệu suất của chúng vẫn yếu hơn rõ rệt so với các mô hình đóng tiên tiến. Lấy Kimi K2.6 (định giá 0,95 USD/4 USD) làm ví dụ, áp lực giảm giá đối với định giá Anthropic Opus là rất hạn chế.

Thứ hai, ràng buộc về sức mạnh tính toán có nghĩa là không có phòng thí nghiệm tiên tiến nào có thể tự đáp ứng toàn bộ nhu cầu thị trường. Anthropic đã bắt đầu chủ động quản lý nhu cầu bằng cách khóa Claude Code sau ngưỡng đăng ký hàng tháng trên 100 USD, hạn chế truy cập của bên thứ ba, v.v. Nhu cầu token sẽ tiếp tục vượt cung trong tương lai có thể thấy trước. Sự khan hiếm cấu trúc này mang lại cho các nhà sản xuất mô hình tiên tiến sự tự tin để định giá theo giá trị thay vì chi phí.

Anthropic đã thực hiện logic này thông qua chiến lược dòng sản phẩm: Opus fast được định giá gấp 6 lần Opus thông thường, Mythos sắp ra mắt được định giá 25 USD/125 USD, gấp 5 lần Opus thông thường, và các khách hàng doanh nghiệp hàng đầu vẫn sẵn sàng trả tiền cho các SKU giá cao này. SemiAnalysis cho biết, nếu Anthropic định giá Mythos fast ở mức 150 USD/750 USD, bản thân họ cũng sẽ là người trả phí.

NVIDIA và TSMC: Sự chậm trễ định giá của tài nguyên khan hiếm

Tuy nhiên, hai công ty nắm giữ nguồn tài nguyên khan hiếm cốt lõi nhất – NVIDIA và TSMC – vẫn chưa theo kịp làn sóng tái định giá này.

Công suất tiến trình N3 tiên tiến của TSMC đã trở thành nút thắt căng thẳng nhất trong toàn bộ mở rộng sức mạnh tính toán AI. NVIDIA, Broadcom, Annapurna, MediaTek và AMD đều đang tranh giành hạn ngạch wafer N3 hạn chế, và tỷ lệ sử dụng công suất N3 dự kiến sẽ vượt 100% vào nửa cuối năm 2026. Tỷ lệ sử dụng nhà máy wafer DRAM đã vượt quá 90%, nguồn cung bộ nhớ tổng thể căng thẳng, nhưng định giá tương đối thận trọng.

SemiAnalysis cho rằng, TSMC hoàn toàn có điều kiện để tăng giá mạnh, và khách hàng không chỉ chấp nhận, mà một số khách hàng thậm chí sẽ hoan nghênh – NVIDIA là trường hợp điển hình: nếu TSMC tăng giá đồng nghĩa với việc đối thủ cạnh tranh nhận được ít hạn ngạch công suất hơn, việc NVIDIA trả giá wafer cao hơn thực tế có lợi cho việc củng cố vị thế thị trường của mình. CEO NVIDIA Jensen Huang từng công khai nói vào năm 2024 rằng TSMC nên tăng giá wafer, logic đằng sau điều này là như vậy.

Chiến lược định giá của chính NVIDIA cũng cho thấy xu hướng bảo thủ tương tự. SemiAnalysis chỉ ra rằng, khung định giá của NVIDIA vẫn neo vào giả định trước đây "giá sẵn lòng trả cho mỗi đơn vị sức mạnh tính toán giảm dần theo thời gian", nhưng giả định này không còn đúng. Với sự bùng nổ của khối lượng công việc AI tác nhân, nhu cầu sức mạnh tính toán không còn tăng tuyến tính, mà thể hiện xu hướng tăng tốc kép.

Hệ thống Rubin: Định lượng không gian định giá của NVIDIA

Lấy Vera Rubin (VR NVL72) sắp ra mắt vào nửa cuối năm 2026 làm tham chiếu, SemiAnalysis đã xây dựng một khung phân tích định giá "Một biểu đồ thống trị tất cả" (One Chart to Rule Them All), neo giữ sàn và trần giá cho thuê từ góc chi phí và góc giá trị.

Phía chi phí (sàn): Dựa trên ngưỡng triển khai tỷ suất hoàn vốn nội bộ (IRR) không thấp hơn 15,6% của các dự án Neocloud (nhà cung cấp dịch vụ đám mây mới nổi), giá cho thuê tối thiểu mỗi GPU mỗi giờ của VR NVL72 cần đạt khoảng 4,92 USD để duy trì ý định triển khai của Neocloud.

Phía giá trị (trần): Neo vào giá cho thuê hợp đồng 5 năm hiện tại của GB300 khoảng 0,70 USD mỗi PFLOP, giới hạn trên của giá cho thuê VR NVL72 là khoảng 12,25 USD mỗi GPU mỗi giờ.

Hiện tại, định giá hệ thống VR NVL72 chỉ khiến chi phí mỗi PFLOP giảm xuống khoảng 0,28 USD, so với GB300 NVL72 giảm 60%, vượt xa mức cải thiện của đường xu hướng lịch sử. Điều này có nghĩa là giá máy chủ của NVIDIA có không gian tăng khoảng 40%, ngay cả sau khi điều chỉnh giá vẫn có thể để lại đủ lợi nhuận cho Neocloud, và mức cải thiện chi phí tổng thể vẫn thấp hơn xu hướng lịch sử.

Định giá bộ nhớ SOCAMM là một biến số quan trọng khác. VR NVL72 sử dụng mô-đun bộ nhớ LPDDR5X dạng khe cắm (SOCAMM), có thể định giá độc lập với đơn vị tính toán. SemiAnalysis ước tính, giá hợp đồng SOCAMM mà NVIDIA trả trong quý 1 năm 2026 là khoảng 8 USD mỗi GB, tăng đáng kể so với quý trước; dự kiến đến cuối năm 2026, giá SOCAMM có thể vượt quá 13 USD mỗi GB. Trong bối cảnh này, việc NVIDIA đạt tỷ suất lợi nhuận gộp 60% trên SOCAMM là hợp lý về mặt logic: một mặt, nguồn cung bộ nhớ hạn chế, NVIDIA nắm giữ lợi thế thị phần lớn nhất; mặt khác, vị thế dẫn đầu về hiệu suất TCO của VR NVL72 khiến khách hàng thiếu các lựa chọn thay thế.

Điểm đến giá trị: Ai đang thắng, ai đang chờ

Khung phân tích của SemiAnalysis tiết lộ mâu thuẫn cốt lõi trong phân phối giá trị AI hiện tại: Sự cải thiện kinh tế token đang nhanh chóng đẩy cao lợi nhuận của các nhà sản xuất mô hình, nhà cung cấp dịch vụ suy luận và Neocloud, nhưng với tư cách là người kiểm soát tài nguyên khan hiếm nhất ở phía cung cấp sức mạnh tính toán, hành vi định giá của NVIDIA và TSMC có sự lệch pha rõ ràng so với sự khan hiếm nguồn cung của họ.

Sự tiếp diễn của sự lệch pha này, về bản chất là một lựa chọn chủ động – NVIDIA đang đóng vai trò tương tự "Ngân hàng trung ương AI", thông qua cải thiện hiệu quả phần mềm để truyền giá trị xuống hạ nguồn, nhằm duy trì động lực mở rộng dài hạn của hệ sinh thái, đồng thời tránh áp lực giám sát chống độc quyền. TSMC tiếp nối triết lý định giá lịch sử "ổn định hệ sinh thái, không hưởng hết lợi ích tăng trưởng".

Tuy nhiên, khi ROI suy luận ngày càng rõ ràng và logic định giá giá trị trở nên phổ biến trên thị trường, áp lực chuyển đổi sang khung định giá giá trị của hai công ty này sẽ tiếp tục tăng. Một khi sự chuyển đổi xảy ra, cục diện phân phối giá trị của chuỗi công nghiệp AI sẽ được tái định hình – lúc đó, quyền thương lượng của phía cung cấp sức mạnh tính toán sẽ trở về tầng phần cứng ở mức độ lớn hơn.

Tuyên bố rủi ro và điều khoản miễn trừ trách nhiệm

        Thị trường có rủi ro, đầu tư cần thận trọng. Bài viết này không cấu thành lời khuyên đầu tư cá nhân, cũng không xem xét đến mục tiêu đầu tư, tình hình tài chính hoặc nhu cầu cụ thể của từng người dùng. Người dùng nên xem xét liệu bất kỳ ý kiến, quan điểm hoặc kết luận nào trong bài viết này có phù hợp với hoàn cảnh cụ thể của họ hay không. Đầu tư theo đó, tự chịu trách nhiệm.
TOKEN-3,03%
VR-0,37%
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim