Giá thuê GPU giảm 30% trong ba tuần, chuỗi giá trị AI đang chuyển dịch từ "di cư lớn" của Nvidia sang chip nhớ

Tác giả: Claude, Deep Tide TechFlow

Deep Tide giới thiệu: Giá thuê chip B200 của Nvidia từ đỉnh điểm cuối tháng 5 là 6.11 USD/giờ đã giảm xuống còn 4.22 USD/giờ, giảm khoảng 30% trong vòng ba tuần. Trong khi đó, ngành bán dẫn xuất hiện sự phân hóa hiếm có: ETF bán dẫn SMH tăng 15% trong tháng qua, Micron và SanDisk tăng gần 60%, trong khi Nvidia lại giảm 3% cùng kỳ. Đối với những người nắm giữ Nvidia hoặc đang xem xét đầu tư hạ tầng AI, một câu hỏi quan trọng đã nổi lên: Tiền dành cho AI không phải ít đi, mà đã chuyển sang nơi khác.

Năm nay, Nvidia vẫn tăng khoảng 12%, nhưng dường như thị trường hiện tại đã không còn chú ý đến nó nữa.

Trong tháng qua, ETF bán dẫn VanEck (SMH) tăng mạnh 15%, Micron và SanDisk đều tăng gần 60%. Nvidia không những không theo kịp, mà còn giảm khoảng 3% ngược xu hướng. Điều rõ ràng hơn nữa là các chỉ số cốt lõi hỗ trợ câu chuyện định giá của Nvidia, giá thuê chip B200 trên đám mây cũng đang yếu đi theo.

Theo dữ liệu từ nền tảng định giá sức mạnh GPU Ornn, giá thuê B200 mỗi giờ đã chạm mức cao mới trong 3 tháng là 6.11 USD vào ngày 30 tháng 5, sau đó liên tục giảm, đến cuối tuần trước đã xuống còn 4.22 USD, giảm khoảng 30%. Giám đốc điều hành Rich Privorotsky của sàn giao dịch Goldman Sachs One-Delta đã trực tiếp nhấn mạnh tuần trước: huyền thoại về “thiếu hụt sức mạnh tính toán” của AI có thể đang sụp đổ.

Giá thuê B200 giảm 30% trong ba tuần, câu chuyện “thiếu hụt sức mạnh tính toán” chịu áp lực

Nvidia B200 là chip trung tâm của các trung tâm dữ liệu quy mô siêu lớn hiện nay, và giá thuê của nó được xem như là chỉ số dự báo cung cầu hạ tầng AI. Dữ liệu từ nhiều nền tảng theo dõi bên thứ ba cho thấy, giá của B200 đang có xu hướng giảm.

Dữ liệu của Ornn cho thấy, giá thuê B200 mỗi giờ đã giảm từ đỉnh 6.11 USD vào ngày 30 tháng 5 xuống còn 4.22 USD vào cuối tuần trước. Chỉ số giá trung bình của 63 nhà cung cấp dịch vụ đám mây do AIMultiple tổng hợp là 6.11 USD/giờ, nhưng các nhà cung cấp mới như neocloud đã đẩy giá thấp xuống còn 3.44 USD. Dữ liệu của GetDeploying theo dõi 26 nhà cung cấp dịch vụ đám mây B200 còn cho thấy, trung bình giá là 4.99 USD/giờ, thấp nhất chỉ 2.25 USD/giờ (hợp đồng đặt trước 3 năm).

Các yếu tố thúc đẩy giá giảm gồm có: tỷ lệ thành công của quy trình công nghệ 4NP của TSMC cải thiện giúp giảm chi phí sản xuất B200; nguồn cung HBM3e của SK Hynix và Micron trong quý 2 năm 2026 trở nên dồi dào hơn; nhiều nhà cung cấp đám mây mới đã có sẵn kho B200, như RunPod, Lambda, Nebius, Spheron, khiến cạnh tranh tăng cao và đẩy giá chung xuống.

Trong nửa cuối năm, áp lực còn lớn hơn nữa. Khi thế hệ chip tiếp theo của Nvidia là Blackwell Ultra B300 bắt đầu vào kho hàng sẵn có, một số năng lực của B200 sẽ chuyển từ theo yêu cầu sang đấu giá. Giá đấu giá (spot) của B300 đã từng thấp đến 2.45 USD/giờ, rẻ hơn cả mức giá thấp nhất của B200. Các tổ chức như Spheron và Thunder Compute dự đoán, giá thuê theo yêu cầu của B200 có thể ổn định quanh mức 2.50 đến 3.00 USD vào quý 4 năm 2026.

Đối với nhà đầu tư nắm giữ Nvidia, giá thuê giảm đồng nghĩa với biên lợi nhuận của khách hàng cuối (nhà cung cấp đám mây, nền tảng đám mây mới) bị áp lực, và ý định mua hàng của các khách hàng này sẽ quyết định tốc độ đặt hàng của Nvidia.

Ngành bán dẫn phân hóa mạnh: bộ nhớ tăng vọt, Nvidia bị bỏ lại phía sau

Sự phân hóa này thật sự gây sốc.

Từ đầu năm 2026 đến nay, Nvidia tăng khoảng 12%, tháng qua giảm khoảng 3%. Trong khi đó, ETF bán dẫn SMH tăng 84% trong năm, và 15% trong tháng. Micron tăng gần 60% trong tháng, giá cổ phiếu đạt đỉnh khoảng 1,089 USD, tăng hơn 700% trong năm, vốn hóa vượt 1,2 nghìn tỷ USD. SanDisk cũng tăng gần 60% trong tháng, và tăng hơn 4,400% trong 52 tuần qua.

Thị trường có thể không còn không thích AI nữa, mà là đang chuyển hướng sang các điểm nghẽn trong chuỗi giá trị AI.

Logic trước đây là “GPU khan hiếm → Nvidia có quyền định giá → các nhà cung cấp phía trên hưởng lợi lớn”. Giờ đây, câu chuyện đã thay đổi: cung GPU đang dồi dào, nhưng nhu cầu về bộ nhớ băng thông cao (HBM) và lưu trữ trong các mô hình AI đang tăng vọt, khiến bộ nhớ trở thành điểm nghẽn mới.

Trong quý 2 năm 2026, doanh thu của Micron đạt 23.8 tỷ USD, tăng gần gấp đôi so với cùng kỳ năm ngoái (80 tỷ USD). SanDisk, sau khi tách khỏi Western Digital, đạt doanh thu 5.95 tỷ USD trong quý 3 tài khóa 2026, tăng 97%.

Dữ liệu của TrendForce ngày 16 tháng 6 cho thấy, giá hợp đồng bộ nhớ trong nửa đầu năm 2026 đã tăng hơn 100%, dự kiến thiếu hụt cấu trúc sẽ kéo dài đến nửa cuối năm. CEO Tim Cook của Apple tuần trước thừa nhận rằng, Apple không thể tiếp tục gánh chịu áp lực tăng giá bộ nhớ. Khi ngay cả Apple, nhà mua có sức đàm phán mạnh nhất, cũng thừa nhận “không thể chịu nổi”, thì quyền định giá của các nhà sản xuất bộ nhớ rõ ràng đã bị ảnh hưởng.

Micron sẽ công bố báo cáo tài chính quý 3 vào ngày mai (24 tháng 6), dự kiến sẽ lập kỷ lục mới. Báo cáo này sẽ là chìa khóa xác nhận liệu “chu kỳ siêu bộ nhớ” có tiếp tục hay không.

Chuyên gia giao dịch của Goldman Sachs: Chỉ số cốt lõi là giá thuê

Tuần trước, giám đốc điều hành Rich Privorotsky của sàn Goldman Sachs One-Delta đã đưa ra một khung đánh giá rõ ràng:

Nếu nguồn lực tính toán thực sự khan hiếm, giá thuê sẽ duy trì vững chắc, và chi tiêu vốn liên tục cũng hợp lý. Ngược lại, nếu nguồn cung tăng và giá thuê liên tục giảm, giả thuyết “thiếu hụt sức mạnh tính toán” – nền tảng định giá toàn bộ chuỗi phần cứng AI – sẽ bị lung lay.

Ông còn nhấn mạnh, áp lực này sẽ thể hiện rõ nhất ở phần cứng. Những người hưởng lợi thực sự là các công ty bán hệ thống hoàn chỉnh và kiếm lời dựa trên khối lượng sử dụng, chứ không chỉ bán “cuốc và xẻng” ở phía trên. Rủi ro lớn hơn nằm ở các phần phía trên của hệ sinh thái phần cứng và hạ tầng, vì ở đó, định giá vẫn dựa trên giả thuyết “thiếu hụt liên tục”.

Thông điệp rõ ràng: Mô hình kinh doanh của Nvidia là bán chip (cuốc và xẻng), chứ không phải tính phí theo mức sử dụng. Nếu giá thuê của khách hàng cuối giảm mà giá chip của Nvidia không giảm, sẽ tạo ra áp lực biên lợi nhuận, cuối cùng dẫn đến chậm lại đơn hàng.

Báo cáo “Tokenomics” gần đây của Citadel Securities cũng phản ánh nhận định tương tự: các hạn chế chính trong việc áp dụng AI đã chuyển từ “khả năng của mô hình” sang “chi phí và thiếu hụt sức mạnh tính toán”, người dùng đang đẩy nhanh chuyển sang các mô hình rẻ hơn. Chỉ số giá token đã giảm liên tiếp 7 ngày, lập kỷ lục giảm dài nhất trong năm nay.

Giáo sư Seoyoung Kim của Đại học Santa Clara mô tả rõ hơn: hầu hết các nhà mua không biết năm tới cần bao nhiêu sức mạnh tính toán, các nhà cung cấp không biết đặt bao nhiêu GPU, Nvidia cũng không biết sản xuất bao nhiêu. Cả ba đều đang đoán, và khi các dự đoán này chuyển từ “không đủ” sang “có thể thừa”, giá sẽ chịu áp lực.

Hợp đồng trị giá 30 tỷ USD giữa SpaceX và Google: Thị trường hợp đồng dài hạn vẫn sôi động

Giá thuê spot giảm, nhưng thị trường hợp đồng dài hạn lại kể một câu chuyện khác.

Theo tài liệu của SpaceX ngày 5 tháng 6 gửi SEC, Google đồng ý từ tháng 10 năm 2026 đến tháng 6 năm 2029 mỗi tháng trả SpaceX 920 triệu USD, thuê khoảng 110.000 GPU Nvidia cùng các bộ xử lý, bộ nhớ và linh kiện khác. Tổng giá trị hợp đồng khoảng 30 tỷ USD. Trước đó, tháng 5, Anthropic đã ký hợp đồng tương tự với SpaceX, trả 1.25 tỷ USD mỗi tháng để thuê toàn bộ năng lực của trung tâm dữ liệu Colossus 1 tại Memphis, tổng giá trị gần 45 tỷ USD.

Hai hợp đồng này phản ánh, sau khi SpaceX hoàn tất sáp nhập xAI vào tháng 2 năm 2026, đã chuyển đổi hệ thống siêu máy tính Colossus tự xây dựng thành tài sản thương mại cho thuê, nhằm mục tiêu thu về doanh thu lớn trước khi IPO (ước tính trị giá 1.75 nghìn tỷ USD).

Đối với Nvidia, đây là tín hiệu mâu thuẫn. Một mặt, hợp đồng dài hạn 11 vạn GPU chứng tỏ khách hàng lớn vẫn đang đặt hàng quy mô lớn, RBC Capital Markets sau khi công bố giao dịch đã nhận định Nvidia “ở vị trí thuận lợi nhất trong ngành”, cho rằng các hợp đồng cho thuê GPU này ít nhất trong ngắn hạn có thể xoa dịu lo ngại về việc ASIC ăn thị phần của Nvidia.

Mặt khác, lý do Google cần thuê sức mạnh tính toán từ SpaceX là vì năng lực tự xây dựng không theo kịp nhu cầu. Chi tiêu vốn của Google trong năm 2026 dự kiến khoảng 180-190 tỷ USD, trong khi khoản thanh toán hàng tháng 9.2 triệu USD của SpaceX chỉ chiếm chưa đến 6% ngân sách hàng năm, thực chất là một “công suất dự phòng”. Khi các trung tâm dữ liệu tự xây của các khách hàng siêu lớn này bắt đầu vận hành vào năm 2027-2028, câu hỏi đặt ra là liệu nhu cầu thuê ngoài có duy trì quy mô hiện tại hay không.

Hợp đồng còn kèm theo điều khoản chấm dứt trước 90 ngày, không giống như các điều khoản ký trong thời điểm “thiếu hụt sức mạnh tính toán cực độ”, mà giống như khách hàng đã để lại lối thoát.

Rủi ro của Nvidia: Không phải từ phía cầu mà từ phía quyền định giá

Kết hợp các dữ liệu trên, vấn đề của Nvidia nằm ở sự thay đổi trong phân phối lợi nhuận của chuỗi giá trị AI.

Về cung GPU, tỷ lệ thành công của quy trình công nghệ 4NP của TSMC cải thiện, nhiều nhà sản xuất khác đã có kho hàng, và B300 sắp ra mắt hàng loạt, tất cả đang làm giảm tình trạng khan hiếm cực đoan trong 2024-2025. Về cầu, các khách hàng siêu lớn vẫn mua hàng quy mô lớn, nhưng hình thức mua đã chuyển từ “mua không tiếc tiền” sang “so sánh giá, đặt hợp đồng dài hạn, giữ quyền rút lui”. Về lợi nhuận, giá thuê của các nhà cung cấp đám mây đã giảm, nếu giá chip của Nvidia không giảm theo, thì biên lợi nhuận trung gian sẽ bị ép, cuối cùng ảnh hưởng đến tốc độ đặt hàng.

Trong khi đó, bộ nhớ trở thành điểm nóng mới, phản ánh sự dịch chuyển của chuỗi giá trị.

Càng lớn mô hình AI, càng nhiều nhiệm vụ suy luận, nhu cầu về bộ nhớ băng thông cao (HBM) càng cứng nhắc. GPU có thể nâng cấp kiến trúc để nâng cao hiệu quả (ví dụ, FP4 của B200 giảm một nửa số byte trên mỗi tham số), nhưng băng thông bộ nhớ là giới hạn vật lý, không có cách nào vượt qua. Nhu cầu về HBM của Micron đã bán hết trong năm 2026, trạng thái “dù có tiền cũng không mua được” này rõ ràng trái ngược với xu hướng giảm giá thuê B200 của Nvidia.

Báo cáo tài chính ngày mai của Micron sẽ cung cấp dữ liệu quan trọng tiếp theo. Nếu doanh thu và dự báo vượt kỳ vọng, câu chuyện “chu kỳ siêu bộ nhớ AI chuyển từ GPU sang bộ nhớ” sẽ càng được củng cố. Đối với nhà đầu tư, đây không phải là dự báo tiêu cực cho AI, mà là cần xem lại ai đang có quyền định giá trong chuỗi này, ai đang mất quyền.

SMH1,10%
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim