Công suất tính toán đang khan hiếm! Chi phí thuê H100 do Nvidia phát hành cách đây bốn năm đã tăng gần 40% trong nửa năm qua

robot
Đang tạo bản tóm tắt

Vào dịp năm mới, khi các “ông lớn” AI như Anthropic, ByteDance… liên tục cho ra mắt các ứng dụng bùng nổ, cộng thêm làn sóng “tôm hùm” thúc đẩy mức sử dụng các mô hình mã nguồn mở tăng mạnh, chip H100 của NVIDIA đã bước vào thời khắc rực rỡ khi giá trị trên thị trường cho thuê đảo chiều theo kiểu “V” ngoạn mục.

Cần biết rằng, đây là sản phẩm mà Hoàng Nhân Huân đã công bố tại GTC tháng 3/2022, và cùng năm đó bắt đầu xuất hàng từ mùa thu.

Theo “Chỉ số giá hợp đồng cho thuê H100 kỳ hạn một năm” do công ty nghiên cứu bán dẫn SemiAnalysis công bố vào hôm thứ Năm, giá hợp đồng thuê của “chip cũ” này sau khi chạm mức 1,7 USD/giờ vào tháng 10/2025, đã bật mạnh lên 2,35 USD/giờ cho mỗi GPU vào tháng 3 năm nay, tăng gần 40%.

(nguồn: SemiAnalysis)

Chỉ số này được xây dựng dựa trên dữ liệu khảo sát trực tiếp đối với hơn 100 nhà cung cấp dịch vụ đám mây, người mua và người bán tài nguyên điện toán, và được thu thập mỗi tháng một lần.

Báo cáo mới nhất cho biết, năng lực tính toán GPU thuê theo nhu cầu (on-demand) đã cạn kiệt trong mọi loại GPU—dù giá có tăng trong thời gian gần đây, các khách hàng đã chốt các instance theo nhu cầu cũng không sẵn sàng giải phóng nguồn lực này trở lại “hồ bơi” tài nguyên. Cơ quan này cũng ví von rằng, việc tìm nguồn lực GPU vào đầu năm 2026 giống như cố đặt vé cho “chuyến bay cuối cùng”: giá cả đắt đỏ và gần như không còn tài nguyên sẵn có.

Các nhà nghiên cứu cho biết thêm: “Khách hàng đang tranh nhau mua các instance đấu giá p6-b200 của Amazon Cloud Services với mức giá 14 USD mỗi GPU mỗi giờ; một số ‘ông lớn’ dịch vụ đám mây mới nổi (Neocloud Giants) thậm chí còn không còn cung cấp bán theo từng nút đơn nữa; một số GPU NVIDIA H100 vẫn gia hạn theo giá gốc được ký từ 2–3 năm trước, và thậm chí có hợp đồng H100 được gia hạn thẳng tới năm 2028.”

Còn với các chip Blackwell có kiến trúc tiên tiến hơn? Các nhà nghiên cứu cho biết, do nhu cầu mạnh mẽ đối với các mô hình quyền trọng số mở (open-weight) và nhu cầu suy luận (inference) tiếp tục tăng vọt, chu kỳ giao hàng cho Blackwell được triển khai mới hiện nay đã kéo dài lên 6 đến 7 tháng.

Vào cuối năm 2025, thị trường từng kỳ vọng rằng việc triển khai tăng tốc các chip Blackwell mạnh hơn, chi phí tính toán thấp hơn sẽ khiến giá cho thuê các chip Hopper (H100, H200) giảm mạnh. Nhưng diễn biến mới nhất lại hoàn toàn ngược lại: hiện tại, nhu cầu đối với H100 không chỉ tiếp tục vững chắc, mà trong nhiều trường hợp còn đang được tăng cường.

Trong báo cáo, SemiAnalysis chỉ ra rằng, một trong những yếu tố thúc đẩy quan trọng nhất đối với nhu cầu điện toán của năm nay đến từ việc tạo nội dung nguyên sinh. Ví dụ, ByteDance’s Seedance (tức Dream) và Google Nano Banana thúc đẩy người dùng tạo và tối ưu lượng lớn video/hình ảnh đã làm cho thông lượng token (token throughput) tăng đáng kể. Nguồn cầu rõ rệt hơn đến từ sự trỗi dậy của khối lượng công việc đa tác nhân (multi-agent), kéo việc sử dụng token và mức tiêu hao điện toán tăng theo dạng hình parabol.

SemiAnalysis cho biết, riêng việc “trong một tuần qua họ đã tiêu tốn hàng chục tỷ token”, và chi phí khoảng 5 USD cho mỗi một triệu token. Tuy nhiên, công ty cũng tỏ ra hài lòng rằng khoản lợi thu được—về thời gian tiết kiệm và việc mở rộng quy trình làm việc lẫn năng lực—vượt xa chi phí điện toán.

Báo cáo cũng chỉ ra rằng, động thái siết chặt nguồn cung điện toán và giá tăng lại tách rời với tâm lý chung rộng rãi trên thị trường. Giá cổ phiếu của các nhà cung cấp dịch vụ đám mây mới nổi như CoreWeave, Nebius đang ở vùng đáy trong khung thời gian 6 đến 12 tháng qua. Phân tích cho thấy, hiện thị trường vẫn đang bám theo khung câu chuyện “cuối cùng sẽ xuất hiện tình trạng dư cung và điện toán sẽ bị hàng hóa hóa”. Nhưng thực tế là, trong môi trường căng thẳng về cung một cách quyết liệt như hiện nay, gần như mọi loại tài nguyên điện toán sẽ tiếp tục duy trì nhu cầu mạnh—dù khác biệt về hiệu năng tương đối thế nào.

Nhìn về tương lai, các nhà nghiên cứu đưa ra ba điểm quan sát then chốt để đánh giá liệu giá thuê GPU có còn giữ ở mức cao.

Thứ nhất, khi các cụm GB300 dần được mở rộng sản lượng trong suốt năm 2026, thị trường sẽ quan tâm liệu nguồn cung mới có thể giải tỏa được tình trạng khan hiếm điện toán hiện tại hay không. Thứ hai, cần theo dõi việc liệu tình trạng thiếu chip liên tục có tiếp tục xấu đi hay không. Cuối cùng, cần quan sát việc mở rộng doanh thu thường niên hằng năm (ARR) của các “ông lớn” AI, cũng như tốc độ phổ biến của các ứng dụng AI và nhịp độ tăng trưởng liên tục về quy mô tiêu hao token.

(Từ nguồn: Yicai Global)

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Gate Fun hot

    Xem thêm
  • Vốn hóa:$2.23KNgười nắm giữ:0
    0.00%
  • Vốn hóa:$2.24KNgười nắm giữ:2
    0.24%
  • Vốn hóa:$2.23KNgười nắm giữ:2
    0.00%
  • Vốn hóa:$2.22KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.22KNgười nắm giữ:1
    0.00%
  • Ghim