Chi phí tính toán AI tăng dần, giá GPU "như dầu mỏ" dao động theo cung cầu.

robot
Đang tạo bản tóm tắt

Chi phí hạ tầng AI đang trải qua một đợt biến động mạnh, và sự khó đoán định của giá máy chủ GPU đã trở thành thách thức cốt lõi đối với các nhà cung cấp dịch vụ đám mây và nhà phát triển AI.

Theo báo cáo của The Information, giá máy chủ AI của NVIDIA đã liên tục tăng trong vài tháng qua do nguồn cung chip nhớ và các linh kiện quan trọng khác bị thắt chặt, biên độ biến động của một số linh kiện trong một tuần lên tới 40%. Tình hình này buộc nhiều nhà cung cấp dịch vụ đám mây phải tăng giá thuê đối với các nhà phát triển AI – nhà cung cấp dịch vụ GPU Nebius đã tăng giá thuê tính năng theo nhu cầu (on-demand) khoảng 30% từ ngày 1 tháng 6, sau đó Amazon AWS thông báo giá EC2 Capacity Blocks sẽ tăng khoảng 20% từ ngày 1 tháng 7.

Biến động giá mạnh đang định hình lại cấu trúc chi phí của toàn bộ thị trường sức mạnh tính toán AI. Carmen Li, CEO của nhà cung cấp dữ liệu giá Silicon Data, cho biết giá thuê GPU mà các nhà cung cấp dịch vụ đám mây tính cho khách hàng đã thể hiện đặc tính cung-cầu tương tự như thị trường hàng hóa (commodity) như dầu mỏ. Các khách hàng nhỏ và vừa thuê tính năng theo nhu cầu là đối tượng chịu ảnh hưởng đầu tiên, và sự thiếu minh bạch của cơ chế định giá thị trường càng làm trầm trọng thêm bất lợi về thông tin của bên mua.

Chi phí linh kiện biến động mạnh, cửa sổ định giá máy chủ cực kỳ hẹp

Sự bất ổn về giá máy chủ GPU bắt nguồn từ sự căng thẳng cao độ của chuỗi cung ứng linh kiện thượng nguồn.

Theo một người bán máy chủ NVIDIA cho các nhà cung cấp dịch vụ đám mây, chi phí của các linh kiện cần thiết cho giá đỡ (rack) máy chủ có thể biến động tới 40% trong một tuần, bao gồm wafer đầu vào do TSMC sản xuất, đóng gói đồng bộ (co-packaging), mạng, tản nhiệt và quan trọng nhất là linh kiện bộ nhớ. Người này nói thẳng rằng giá của giá đỡ máy chủ GPU "biến động rất mạnh", "mọi thứ có thể thay đổi hoàn toàn trong hai đến ba tuần, hoàn toàn không thể dự đoán xu hướng giá, chỉ có thể khóa giá trong một cửa sổ cực kỳ ngắn", không thể lập kế hoạch chi phí dài hạn.

Một giám đốc điều hành của nhà cung cấp dịch vụ đám mây GPU cho biết giá đỡ máy chủ mà công ty mua gần đây tăng khoảng 2% đến 3% mỗi tuần. Một giám đốc điều hành khác từ đối thủ cạnh tranh chỉ ra rằng ổ đĩa lưu trữ NVMe trong giá đỡ NVIDIA Grace Blackwell 300 là nguồn biến động giá chính, vài tháng trước biến động "rất mạnh", hiện tại chi phí giá đỡ cao hơn 10% đến 15% so với "giá cơ sở" mà họ xác định, xu hướng tăng giá của giá đỡ GB300 dường như đang ổn định, mức tăng hàng tháng khoảng 1%.

Tác động của biến động giá được khuếch đại mạnh mẽ do giá trị tuyệt đối lớn. Chỉ một giá đỡ chứa hệ thống chip Grace Blackwell 300, mỗi hệ thống chip có giá 70.000 USD, tổng giá trị của một giá đỡ đầy đủ 72 hệ thống là khoảng 5 triệu USD, và một số khách hàng mua số lượng lên tới hàng nghìn bộ. Theo một giám đốc điều hành khách hàng đang mua giá đỡ Vera Rubin, giá ước tính của mẫu giá đỡ này là khoảng 7 triệu USD.

Quyền định giá được truyền dọc theo chuỗi cung ứng, NVIDIA và các nhà sản xuất bộ nhớ nắm quyền chủ đạo

Đằng sau đợt tăng chi phí này là sự tập trung cao độ quyền định giá ở các mắt xích trong chuỗi cung ứng.

Người bán máy chủ nói trên cho biết NVIDIA "gần như có thể yêu cầu bất kỳ mức giá nào". Người phát ngôn của NVIDIA trả lời rằng giá phụ thuộc vào chi phí linh kiện của giá đỡ máy chủ, công ty hợp tác với các nhà cung cấp máy chủ để định giá, và có thể có sự khác biệt về giá giữa các nhà cung cấp khác nhau. Dữ liệu cho thấy biên lợi nhuận gộp của NVIDIA đã tăng 15 đến 20 điểm phần trăm trong vài năm qua, xác nhận khả năng định giá thị trường mạnh mẽ của họ.

Đồng thời, các nhà sản xuất chip nhớ như Micron đang gây áp lực định giá tương tự lên NVIDIA và các khách hàng khác, thúc đẩy giá tăng trên toàn bộ sản phẩm từ Apple Mac đến GPU NVIDIA.

Carmen Li chỉ ra rằng một khi chip rời khỏi NVIDIA, giá cho thuê của các nhà cung cấp dịch vụ đám mây bắt đầu thể hiện logic cung-cầu của thị trường hàng hóa. Dữ liệu của cô cho thấy giá thuê chip Blackwell 200 đã tăng khoảng 20% từ đầu năm; giá thuê các chip NVIDIA đời cũ sau khi tăng tổng cộng hơn 20% trong năm qua, gần như ổn định trong 30 ngày gần đây.

Khách hàng nhỏ và vừa chịu áp lực nặng nhất, thị trường thiếu minh bạch về định giá

Trong đợt tăng giá này, các khách hàng thuê tính năng theo nhu cầu là đối tượng dễ bị tổn thương nhất.

Các nhà cung cấp dịch vụ đám mây đang thăm dò mức giá trần trong môi trường khan hiếm GPU hiện tại, hoặc ưu tiên phân bổ tài nguyên máy chủ cho khách hàng lớn, dẫn đến giảm nguồn lực tính toán cho khách hàng nhỏ và vừa. Tuy nhiên, xu hướng giá không phải một chiều. Một giám đốc điều hành công ty phát triển mô hình AI cho biết sau khi giá tăng gấp đôi trong một đến hai tháng trước, thực tế giá đã giảm trong hai tuần gần đây. Sự khác biệt này phản ánh thị trường dịch vụ đám mây GPU vẫn ở giai đoạn tương đối sớm, cộng với số lượng nhà cung cấp dịch vụ GPU tăng vọt, cấu trúc thị trường chưa ổn định.

Sự thiếu minh bạch về định giá càng làm gia tăng sự không chắc chắn của bên mua. Các nhà cung cấp dịch vụ đám mây GPU thường không công bố giá thực tế, điều này khiến quyền định giá thực sự nằm trong tay nhà cung cấp, chứ không phải khách hàng.

Một nhà đầu tư của nhà cung cấp dịch vụ đám mây GPU bày tỏ lo ngại: "Đối với các khách hàng cốt lõi của chúng tôi, tồn tại một điểm tới hạn – một khi không thể tính toán hiệu quả kinh tế, hoạt động kinh doanh của họ sẽ khó duy trì, và chúng tôi tuyệt đối không muốn chạm đến ranh giới đỏ đó." Tuyên bố này tiết lộ rằng chi phí sức mạnh tính toán liên tục tăng cuối cùng sẽ tạo ra ràng buộc thực chất đối với khả năng khả thi thương mại của tầng ứng dụng AI.

Tuyên bố miễn trừ trách nhiệm và rủi ro

        Thị trường có rủi ro, đầu tư cần thận trọng. Bài viết này không cấu thành lời khuyên đầu tư cá nhân, và cũng không xem xét mục tiêu đầu tư, tình hình tài chính hoặc nhu cầu đặc biệt của từng người dùng. Người dùng nên xem xét bất kỳ ý kiến, quan điểm hoặc kết luận nào trong bài viết này có phù hợp với tình hình cụ thể của họ hay không. Đầu tư dựa trên đó là tự chịu trách nhiệm.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim