Khi Meta bắt đầu bán sức mạnh tính toán

Ngày 1 tháng 7, Bloomberg đưa tin: Meta đang thúc đẩy một dự án có mã hiệu "Meta Compute", dự định bán năng lực tính toán AI dư thừa cho khách hàng bên ngoài.

Hai hướng đi được thúc đẩy song song:

  • Dịch vụ truy cập mô hình——cung cấp các mô hình như Llama và Muse Spark cho doanh nghiệp, tính phí theo lượng token sử dụng, cạnh tranh với AWS Bedrock;
  • Bán trực tiếp năng lực tính toán thô——cho thuê cụm GPU theo giờ, cạnh tranh với CoreWeave.

Tin tức vừa ra, thị trường lập tức phản ứng: cổ phiếu META tăng khoảng 9% trong ngày (CNBC), nhà đầu tư coi đây là phản hồi trực tiếp của Zuckerberg trước nghi vấn "liệu khoản đầu tư AI 100 tỷ đô có thể thu hồi vốn hay không".

Ở phía bên kia, CoreWeave và Nebius đều giảm khoảng 15% (247 Wall St)——hai công ty Neocloud (đám mây AI mới nổi) kiếm sống bằng "bán thời gian GPU" bỗng nhiên có thêm một đối thủ lớn gấp hàng chục lần quy mô của mình.

Đây không phải ngẫu nhiên. Trong cuộc họp cổ đông tháng 5, Zuckerberg đã nói:

"Đây chắc chắn là một trong những lựa chọn của chúng tôi. Hầu như mỗi tuần, các công ty bên ngoài đều liên hệ với chúng tôi, hy vọng chúng tôi ra mắt dịch vụ API, hoặc hỏi liệu họ có thể mua năng lực tính toán của chúng tôi hay không, thậm chí sẵn sàng trả giá cao hơn chi phí mua sắm của chúng tôi."

Ông nói đầy đủ lúc đó: "Hiện tại chúng tôi chưa làm điều này, vì chúng tôi cho rằng năng lực tính toán này vẫn có mục đích sử dụng riêng. Tuy nhiên, nếu trong tương lai chúng tôi cho rằng việc xây dựng năng lực tính toán đã dư thừa, thì đây sẽ là một lựa chọn chúng tôi có thể thực hiện."

Câu nói này hiện đang được biến thành hành động.

Cược 145 tỷ đô la

Để hiểu tại sao Meta lại bán năng lực tính toán, trước hết phải biết nó đã xây dựng bao nhiêu.

Tháng 4 năm 2026, Meta điều chỉnh dự báo chi tiêu vốn cả năm lên 1250 tỷ – 1450 tỷ đô la (xác nhận bởi SEC 10-Q), gần gấp đôi so với capex thực tế năm 2025 là 72,2 tỷ đô la. Con số này đã khiến nhà đầu tư hoảng loạn trong cuộc họp báo cáo tài chính – cổ phiếu giảm 10% trong ngày.

Nhưng Zuckerberg không lùi bước. Logic của ông là:

"Nút thắt lớn nhất của toàn ngành vẫn là nguồn cung năng lực tính toán, vì vậy chúng ta nên dự trữ càng nhiều tài nguyên tính toán càng tốt, sau đó mới quyết định cách sử dụng."

Cụ thể đã xây bao nhiêu? Một vài con số:

Đây không phải vấn đề riêng của Meta. Microsoft, Google, Amazon cũng đang đồng loạt đổ tiền. Năm 2026, tổng capex của bốn gã khổng lồ công nghệ gần chạm 700 tỷ đô la.

Số tiền này không mua phần mềm, mà là thép, điện, GPU NVIDIA, và từng khu trung tâm dữ liệu mọc lên.

Tại sao có dư thừa: Khoảng cách sử dụng giữa huấn luyện và suy luận

Năng lực tính toán có một vấn đề vật lý: nó không được tiêu thụ đồng đều.

Một tác vụ huấn luyện mô hình ngôn ngữ lớn có thể sử dụng 100% vài chục nghìn GPU trong vài tháng. Nhưng sau khi huấn luyện xong, tỷ lệ sử dụng của cụm này đột ngột giảm xuống còn 30%–50%——chỉ còn các yêu cầu suy luận chạy, mà nhu cầu tính toán cho suy luận thấp hơn nhiều so với huấn luyện.

Nhịp độ huấn luyện của Meta đã được biết công khai: Llama 4 đã huấn luyện xong, Llama 5 vẫn đang trên đường. Trong khoảng trống giữa các lần huấn luyện, cụm máy vẫn ở đó, tiêu tốn tiền điện, không tạo ra lợi nhuận.

Chiến lược của Zuckerberg gọi là "Tích trữ trước, quyết định sau" (Hoard now, decide later). Trước tiên xây dựng cơ sở hạ tầng theo nhu cầu huấn luyện đỉnh điểm, còn sau khi xây xong thì sử dụng thế nào – khi đó tính sau.

Tiền đề của chiến lược này là: Trong tương lai sẽ luôn có lý do để sử dụng năng lực tính toán này. Và "bán ra" là một trong những lý do đó.

Xét theo quy luật vật lý, đây không phải là sự lãng phí do quản lý kém của Meta – đây là chu kỳ cố hữu của cơ sở hạ tầng tính toán. Chỉ cần bạn đang nghiên cứu và phát triển AI tiên tiến, sớm muộn bạn sẽ đối mặt với vấn đề này.

Điểm khác biệt của Meta: Nó là người đầu tiên thừa nhận điều này và bắt đầu hành động.

Người tiên phong xuất hiện: Kinh doanh năng lực tính toán của SpaceX/xAI

Meta không phải là người đầu tiên làm điều này.

Tháng 5 năm 2026, SpaceX/xAI của Musk đã hoàn thành hai hợp đồng cho thuê năng lực tính toán gây chấn động thị trường:

Hợp đồng đầu tiên: Anthropic thuê Colossus 1

  • Tiền thuê hàng tháng: 1,25 tỷ đô la
  • Thời hạn hợp đồng: đến năm 2029
  • Tổng giá trị hợp đồng: khoảng 45 tỷ đô la
  • Tài sản: Toàn bộ năng lực tính toán khả dụng của trung tâm dữ liệu Colossus 1 ở Memphis, Tennessee (hơn 200.000 GPU NVIDIA)

Hợp đồng thứ hai: Google thuê Colossus 2

  • Tiền thuê hàng tháng: 920 triệu đô la
  • Tài sản: Cụm năng lực tính toán của trung tâm dữ liệu Colossus 2

Hai hợp đồng này cộng lại, chỉ riêng "cho thuê GPU" mỗi năm SpaceX/xAI đã thu về hơn 26 tỷ đô la.

Quan trọng hơn: Nó đã xác minh tính khả thi của con đường "tự xây trung tâm dữ liệu → bán năng lực tính toán".

Con đường Meta đang đi cũng chính là con đường đó. Và quy mô của Meta lớn hơn nhiều so với xAI – họ đã cam kết đầu tư 182,9 tỷ đô la để xây dựng cơ sở hạ tầng.

Ai bị tổn thương nhất: Sự chèn ép kép của Neocloud

Sự gia nhập của Meta tạo áp lực trực tiếp nhất lên Neocloud.

Mô hình kinh doanh của các công ty này rất đơn giản: Mua/cho thuê GPU số lượng lớn từ thượng nguồn (NVIDIA hoặc các nhà mua siêu lớn như Meta), sau đó chia nhỏ thành năng lực tính toán theo giờ để cho thuê cho các startup AI, viện nghiên cứu, doanh nghiệp hạ nguồn.

CoreWeave là nổi tiếng nhất trong số đó – IPO tháng 3 năm 2025, vốn hóa thị trường từng vượt 50 tỷ đô la. Tài sản cốt lõi của nó là một đống GPU và một loạt hợp đồng khách hàng dài hạn.

Nhưng sau khi Meta gia nhập, mô hình kinh doanh của CoreWeave xuất hiện hai vết nứt:

Vết nứt thứ nhất: Khách hàng hạ nguồn bị phân luồng. Nếu các startup AI có thể thuê năng lực tính toán trực tiếp từ Meta – và GPU của Meta mới hơn, quy mô lớn hơn, giá có thể thấp hơn – thì tại sao lại tìm đến CoreWeave?

Vết nứt thứ hai: Khách hàng lớn nhất trở thành đối thủ. CoreWeave và Meta đã có sự hợp tác sâu rộng. Tháng 4 năm 2026, CoreWeave ký hợp đồng cung cấp năng lực tính toán tổng trị giá 35 tỷ đô la với Meta (đến năm 2032), trong đó 21 tỷ là phần mới cho giai đoạn 2027–2032. Nebius cũng ký hợp đồng tương tự trị giá 27 tỷ đô la với Meta. Hướng của các hợp đồng này là CoreWeave/Nebius cung cấp năng lực tính toán cho Meta – Meta là bên mua.

Nếu Meta quyết định tự xây dựng năng lực tính toán và bán ra ngoài, rất có thể họ sẽ giảm mua hàng từ CoreWeave và Nebius. Tỷ lệ gia hạn và khối lượng mới của các hợp đồng này sẽ bị giảm sút. Thị trường định giá không chỉ là "Meta trở thành đối thủ cạnh tranh", mà còn là "Meta không còn là khách hàng lớn đáng tin cậy".

Còn một rủi ro sâu xa hơn: Định giá tài sản thế chấp để tài trợ.

Việc mở rộng của Neocloud phụ thuộc nhiều vào tài trợ bằng nợ, và tài sản thế chấp chính là các cụm GPU của họ. Tháng 3 năm 2026, CoreWeave đã đóng một khoản vay có kỳ hạn 8,5 tỷ đô la được bảo đảm bằng GPU – được cho là khoản nợ thế chấp GPU đầu tiên đạt cấp đầu tư trong ngành (công bố Nasdaq). Nếu các nhà chơi siêu lớn như Meta tham gia quy mô lớn vào thị trường cho thuê năng lực tính toán, giá cho thuê GPU theo giờ sẽ giảm – giá trị tài sản thế chấp sẽ thu hẹp – tái cấp vốn bằng nợ sẽ trở nên khó khăn.

Đây không phải suy luận lý thuyết. Ngày tin tức được công bố, CoreWeave giảm 15%. Thị trường đang định giá lại.

Bức tranh lớn hơn: Canh bạc cơ sở hạ tầng 700 tỷ đô la, ai chạy trước?

Mở rộng tầm nhìn. Meta bán năng lực tính toán không chỉ là chuyện của riêng Meta.

Năm 2026, tổng capex của bốn gã khổng lồ công nghệ gần chạm 700 tỷ đô la. Phần lớn số tiền này đổ vào cùng một hướng: Cơ sở hạ tầng AI.

Câu hỏi đặt ra: Sau khi xây xong, tỷ lệ sử dụng sẽ là bao nhiêu?

Logic của phe giảm giá:

  • Giá năng lực tính toán GPU tiếp tục giảm. Giá theo yêu cầu thấp nhất cho instance B300 khoảng 7,4 đô la/giờ, spot instance thấp nhất 4,3 đô la/giờ (GPUFinder, tháng 7 năm 2026). Nhìn tổng thể, chi phí suy luận LLM đã giảm khoảng 1000 lần trong ba năm (GPU Nexus).
  • Hiệu suất suy luận đang tăng vọt. DeepSeek R1, các mô hình mới nhất của Anthropic đều làm được nhiều hơn với ít năng lực tính toán hơn.
  • Một số nhà phân tích ví von điều này giống như việc xây dựng quá mức cáp quang vào cuối những năm 1990 – lúc đó các công ty viễn thông điên cuồng lắp đặt cáp quang, kết quả là cung vượt cầu, giá sụp đổ, hàng loạt công ty phá sản.

Logic của phe tăng giá:

  • Nghịch lý Jevons: Năng lực tính toán càng rẻ, càng nhiều người sử dụng. Không phải tăng tuyến tính, mà là tăng theo cấp số nhân.
  • Nhu cầu suy luận đang bùng nổ. Năm 2026, tải suy luận đã chiếm khoảng hai phần ba tổng năng lực tính toán AI, cao hơn nhiều so với một phần ba của một năm trước.
  • Tỷ lệ thâm nhập AI hiện tại, tương đương với Internet năm 1995 – lúc đó bạn nghĩ xây dựng quá nhiều, nhưng nhìn lại, xây vẫn chưa đủ.

Cả hai bên đều có lý. Nhưng có một sự thật không thể tranh luận:

Meta không đợi đến khi "xác nhận dư thừa" mới bắt đầu bán năng lực tính toán. Nó đã để lại lối thoát cho "có thể dư thừa".

Đây mới là tín hiệu thực sự đáng chú ý. Nếu bạn tin tưởng 100% vào nhu cầu năng lực tính toán của mình, bạn không cần lên kế hoạch bán năng lực tính toán từ trước. Cứ xây là được.

Meta đã chuẩn bị phương án dự phòng. Còn những người khác?

Microsoft, Google, Amazon – công việc kinh doanh chính của họ là bán đám mây, không có vấn đề "có bán năng lực tính toán hay không", họ luôn bán. Vấn đề thực sự là: Họ cũng đang mở rộng điên cuồng, và tốc độ mở rộng không hề chậm hơn Meta.

Nếu những người mua lớn nhất đều đang tự để lại lối thoát cho mình – thì thị trường này, nước có thể không sâu đến thế.

Vết nứt đầu tiên của đầu tư cơ sở hạ tầng

Hai năm qua, logic đầu tư cơ sở hạ tầng AI là: "Nhu cầu là vô hạn, năng lực tính toán không bao giờ đủ." Bây giờ, logic này đã xuất hiện vết nứt đầu tiên – không phải vì nhu cầu biến mất, mà vì tốc độ xây dựng nguồn cung có thể đã chạy trước nhu cầu.

Meta bán năng lực tính toán đánh dấu giai đoạn chuyển từ "xây dựng không kể chi phí" sang "bắt đầu tính toán sổ sách".

Những điều đáng theo dõi tiếp theo:

  1. Microsoft có làm theo không? Họ có quan hệ hợp tác sâu với OpenAI, cũng có lượng lớn năng lực tính toán Azure – họ không cần xây mới, họ đã bán rồi. Nhưng tốc độ mở rộng của họ có chậm lại không?
  2. Báo cáo tài chính quý tiếp theo của CoreWeave. Liệu nó có thể chứng minh bằng dữ liệu hợp đồng rằng mình không bị ảnh hưởng?
  3. Xu hướng giá cho thuê GPU theo giờ. Nếu Meta chính thức tham gia thị trường, liệu cuộc chiến giá cả có bùng nổ?

Tuyên bố rủi ro và điều khoản từ chối trách nhiệm

        Thị trường có rủi ro, đầu tư cần thận trọng. Bài viết này không cấu thành lời khuyên đầu tư cá nhân, cũng không xét đến mục tiêu đầu tư, tình hình tài chính hoặc nhu cầu đặc biệt của từng người dùng. Người dùng nên xem xét liệu bất kỳ ý kiến, quan điểm hay kết luận nào trong bài viết có phù hợp với tình huống cụ thể của họ hay không. Đầu tư dựa trên bài viết này, tự chịu rủi ro.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim