Điều chỉnh trong lĩnh vực lưu trữ, là sai lầm dẫn đến bị loại bỏ hay là sự sụp đổ về logic?

Tuần này, một công nghệ mới của Google ra mắt, trực tiếp khiến lĩnh vực lưu trữ bị sốc. Lấy Micron Technology làm ví dụ, cổ phiếu đã giảm liên tiếp năm phiên, các cổ phiếu liên quan trên thị trường A cũng xuất hiện điều chỉnh tương tự.

TurboQuant, được cho là có thể giảm nhu cầu lưu trữ KV Cache cho văn bản dài xuống 6 lần và tăng tốc độ suy luận lên 8 lần, sau khi công bố, cổ phiếu lưu trữ đã đồng loạt lao dốc, nhiều người kêu gọi “Nhu cầu lưu trữ AI sắp mất đi”.

Nhưng nếu bạn suy nghĩ kỹ, điều này có phải là hơi quen thuộc không? Khi công nghệ GQA ra mắt năm 2023, cũng đã có người nói rằng nhu cầu KV Cache sẽ giảm một nửa, lưu trữ sẽ hạ nhiệt; Khi PagedAttention ra mắt năm 2024, luận điệu tương tự lại xuất hiện.

Và kết quả là gì? Trong hai năm qua, lượng token tiêu thụ của các mô hình lớn trên toàn cầu đã tăng gấp 10 lần trở lên, nhu cầu lưu trữ ngược lại càng tăng mạnh mẽ.

01 Sự thật về TurboQuant: Nén không nhất thiết là tin xấu

Nhiều người nghe thấy, nén 6 lần, vậy nhu cầu lưu trữ không phải giảm xuống 6 lần sao? Điều này không phải giết chết các nhà sản xuất lưu trữ sao?

Nếu bạn nghĩ như vậy, bạn đã hiểu sai logic của công nghệ này.

Nói một cách đơn giản, KV Cache là khi mô hình lớn suy luận, cần lưu lại nội dung cuộc hội thoại trước đó, nếu không nó sẽ quên những gì bạn đã nói trước đó, cái này chiếm phần lớn nhu cầu lưu trữ trong giai đoạn suy luận. Và nén mà TurboQuant thực hiện là để giải quyết nút thắt chính của suy luận AI — bức tường bộ nhớ.

Bây giờ, bối cảnh của mô hình lớn đã từ 4K trước đây tăng lên 128K, thậm chí hàng triệu, hàng chục triệu yêu cầu suy luận đồng thời cũng ngày càng nhiều, nếu không thực hiện nén, cho dù bạn có chất đống tất cả HBM cũng không đủ dùng, hơn nữa, chi phí chuyển dữ liệu cao hơn nhiều so với chi phí tính toán, sẽ làm chậm tốc độ suy luận.

Vì vậy, nén là để cho suy luận dài ngữ cảnh và cao đồng thời có thể hoạt động, không phải để giảm bớt lưu trữ.

Hơn nữa, đây không phải là điều gì mới mẻ, ngành công nghiệp đã bắt đầu phát triển từ lâu.

GQA năm 2023 đã nén KV Cache từ 4-8 lần; năm 2024, lượng hóa và PagedAttention lại nén thêm 2-4 lần, mỗi lần đều có người nói nhu cầu lưu trữ sẽ không còn, và kết quả là gì?

Mỗi lần nén xong, mọi người đều dám mở rộng làm ngữ cảnh dài hơn, làm nhiều yêu cầu đồng thời hơn, trước đây không thể sử dụng để suy luận văn bản dài, giờ có thể sử dụng được, nhu cầu mới lại lấp đầy không gian mà nén tiết kiệm được, thậm chí còn không đủ.

Đây là hiệu ứng Jevons trong kinh tế học, ví dụ điển hình nhất là nén video: Khi H.264, H.265 ra đời, đã giảm một nửa nhu cầu lưu trữ cho video, kết quả mọi người lại bắt đầu làm video chất lượng cao 4K, 8K, thậm chí bây giờ video dài 10 phút cũng dễ dàng có kích thước trên 10GB+, cuối cùng tổng nhu cầu lưu trữ video lại tăng hàng chục lần.

TurboQuant cũng có lý do tương tự. Nén 6 lần, nhìn có vẻ lớn, nhưng bạn xem nhu cầu hiện tại tăng trưởng: Vào tháng 2 năm 2026, lượng token tiêu thụ của các mô hình lớn toàn cầu là gấp 10 lần so với cùng kỳ năm trước, đến năm 2028, lượng dữ liệu toàn cầu sẽ tăng lên 394ZB, gấp hơn 5 lần so với năm 2020. Chút nén này, trước sự tăng trưởng nhu cầu theo cấp số nhân, thực sự chỉ như muối bỏ bể.

Quan trọng hơn, việc nén dẫn đến giảm chi phí sẽ giải phóng ra nhiều nhu cầu mới hơn.

Trước đây, suy luận dài ngữ cảnh rất đắt đỏ, nhiều doanh nghiệp không đủ khả năng sử dụng, giờ chi phí giảm, họ dám sử dụng, các nhà cung cấp đám mây cũng dám mở rộng giới hạn ngữ cảnh, mở rộng giới hạn đồng thời, cuối cùng, tổng nhu cầu lưu trữ sẽ càng được phóng đại hơn.

Nói một cách đơn giản, TurboQuant là tối ưu hóa từ phía cung, không phải sự biến mất từ phía nhu cầu. Nó là một tối ưu hóa để giảm bớt bức tường bộ nhớ trong bối cảnh cung không đủ HBM.

Nhìn ngắn hạn, vẫn còn khoảng cách cung cầu về HBM, thậm chí do sự giải phóng nhu cầu này, khoảng cách này sẽ ngày càng lớn.

02 Chu kỳ dài hạn gặp phải thiên nga đen địa chính trị

Thực ra, trước biến động của TurboQuant này, ngành lưu trữ đã bước vào chu kỳ siêu thịnh vượng từ lâu, sự căng thẳng giữa cung và cầu đã đạt đến mức cực hạn.

Phía nhu cầu, sự bùng nổ của AI đã kéo nhu cầu lưu trữ lên mức cao chưa từng có.

Trước đây, nhu cầu lưu trữ phụ thuộc vào PC, điện thoại, giờ đây, máy chủ AI và ứng dụng đa phương thức đã trở thành động cơ mới.

Seedance 2.0 của ByteDance, làm video 10 phút, tiêu thụ token là hàng chục lần so với văn bản, kiến trúc mới của Nvidia đã đưa nhu cầu NAND từ cấp TB lên cấp PB, dung lượng tủ đơn đã tăng gấp 5 lần.

Các ông lớn Internet toàn cầu đều đang điên cuồng đầu tư vào hạ tầng tính toán, đến năm 2026, chi tiêu vốn của tám CSP hàng đầu sẽ tăng 25%, đạt 500 tỷ USD, phần lớn số tiền này sẽ được đổ vào cơ sở hạ tầng AI, trong đó, lưu trữ chính là nhu cầu cốt lõi nhất.

Còn phía cung, ba gã khổng lồ lưu trữ nước ngoài, Samsung, SK Hynix, Micron, đã từ lâu khóa chặt năng lực sản xuất.

Sau khi trải qua vòng chu kỳ trước đó với thua lỗ, giờ họ đang rất thận trọng trong việc mở rộng sản xuất, và tất cả năng lực mới đều được đổ vào các sản phẩm cao cấp có lợi nhuận cao như HBM, DDR5, trong khi năng lực DRAM, NAND thấp hơn lại đang thu hẹp.

Điều nghiêm trọng hơn là, năng lực HBM cao cấp căn bản không thể mở rộng.

Xây dựng một phòng sạch cần 8-12 tháng, thời gian phục hồi tỷ lệ sản phẩm đạt tiêu chuẩn còn lâu hơn.

Hiện tại, kho hàng của ba nhà sản xuất chính đã xuống đến mức thấp nhất lịch sử 3-5 tuần, có nghĩa là hàng hóa trong tay họ, sau khi bán hết, lô hàng tiếp theo vẫn chưa sản xuất ra, cung đã cứng nhắc đến mức cực hạn.

Sự căng thẳng giữa cung và cầu này đã khiến giá lưu trữ tăng lên trong vài tháng qua.

Báo cáo tài chính mới nhất của Micron chính là minh chứng tốt nhất: Trong quý tài chính FY26Q2, doanh thu của họ đã đạt 23.86 tỷ USD, tăng 196% so với năm trước, lợi nhuận ròng đạt 14.021 tỷ USD, tăng 686%, tỷ lệ lợi nhuận gộp kinh doanh trực tiếp đạt 69%, đó chính là sức mạnh của chu kỳ siêu thịnh vượng.

Và ngay lúc này, cuộc xung đột ở Hormuz đã trực tiếp thổi bùng lên sự căng thẳng cung cầu đã đến cực hạn này.

Bạn cần biết rằng, năng lực sản xuất lưu trữ toàn cầu phần lớn nằm ở Hàn Quốc, Samsung và SK Hynix chiếm tới 70% năng lực DRAM toàn cầu, và Hàn Quốc, 70% lượng dầu nhập khẩu đều phụ thuộc vào Trung Đông, hầu như hoàn toàn thông qua Eo biển Hormuz.

Điều nghiêm trọng hơn là, những khí gas quý cần thiết cho sản xuất lưu trữ, như khí heli, Hàn Quốc phụ thuộc 64.7% vào Qatar, trong khi Qatar đã ngừng sản xuất heli, cắt giảm 30% cung cấp toàn cầu; còn với khí neon, phần lớn nguồn cung đều đến từ Iran, giờ đây những thứ này đã trở thành bom hẹn giờ trong chuỗi cung ứng.

Đây chính là tình hình hiện tại của ngành lưu trữ: logic dài hạn là chu kỳ nhu cầu siêu lớn do AI mang lại, cung cứng nhắc, giá tiếp tục tăng; logic ngắn hạn là xung đột địa chính trị ở Hormuz đã đâm trúng điểm yếu của năng lực lưu trữ nước ngoài, làm cho cung cứng đã căng thẳng càng trở nên căng thẳng hơn.

03 Ai có thể nắm bắt cơ hội thiếu hụt cung toàn cầu này?

Nhiều người sẽ hỏi, vậy trong thời điểm này, cơ hội cho lưu trữ nội địa nằm ở đâu? Những phân khúc nào là đáng chú ý nhất?

Thực ra rất đơn giản, chỉ cần nắm bắt hai yếu tố cốt lõi: Thứ nhất, tìm những khâu có cung nước ngoài dễ bị ảnh hưởng bởi địa chính trị; thứ hai, tìm những doanh nghiệp nội địa đã có bước đột phá công nghệ và sẵn sàng năng lực sản xuất, chỉ có họ mới có thể nắm bắt được cơ hội bùng nổ này.

Đầu tiên, chính là các khâu liên quan đến HBM và DRAM cao cấp.

Bạn hãy nghĩ xem, năng lực sản xuất của Samsung và SK Hynix đã bị Nvidia khóa chặt, nếu năng lực của họ, vì vấn đề năng lượng, nguyên liệu mà gặp trục trặc, thì ai sẽ bù đắp cho khoảng trống này?

Đầu tiên chắc chắn là các nhà máy sản xuất chip lưu trữ nội địa ở thượng nguồn, hiện tại năng lực của họ đang nhanh chóng mở rộng, tỷ lệ sản phẩm đạt tiêu chuẩn cũng đã tăng lên, và họ cũng đang nỗ lực nghiên cứu phát triển HBM, nếu cung cấp nước ngoài gặp vấn đề, khách hàng có thể sẽ chủ động tăng tốc độ xác minh sản phẩm nội địa.

Còn nữa là khâu lắp ráp mô-đun lưu trữ ở giữa.

Ví dụ như các doanh nghiệp như Jiang Bolong và Bawei Storage, họ vốn đã có kênh khách hàng trưởng thành, nếu cung cấp wafer nước ngoài gặp vấn đề, giá cả tăng lên, họ có thể dựa vào năng lực wafer nội địa để cung cấp cho khách hàng những sản phẩm lưu trữ ổn định và rẻ hơn.

Trước đây, mọi người đều cảm thấy chuỗi cung ứng nước ngoài rất ổn định, nên không muốn mạo hiểm chuyển sang sản phẩm nội địa, nhưng xung đột địa chính trị đã thổi hồi chuông cảnh tỉnh cho tất cả mọi người: Hóa ra chuỗi cung ứng nước ngoài cũng có thể bị đứt? Hóa ra việc đặt tất cả năng lực sản xuất vào nước ngoài, rủi ro lớn như vậy?

Hơn nữa, giá dầu tăng đã khiến chi phí của các doanh nghiệp nước ngoài tăng vọt, lợi thế về chi phí của các doanh nghiệp nội địa càng trở nên rõ ràng hơn.

Tóm lại, logic dài hạn của lưu trữ là chu kỳ nhu cầu siêu lớn do AI mang lại và cuộc đua thay thế nội địa kéo dài hàng thập kỷ; yếu tố thúc đẩy ngắn hạn là xung đột địa chính trị lần này đã đẩy nhanh toàn bộ quá trình.

Tuy nhiên, với việc các cổ phiếu trong lĩnh vực này đã tăng giá khá nhiều trước đó, có thể đã phản ánh đầy đủ kỳ vọng lạc quan của thị trường, cần phải cảnh giác với nhiều rủi ro trong các khoản đầu tư tiếp theo:

Rủi ro phát triển AI không đạt kỳ vọng: Hiện tại, nhu cầu lưu trữ do AI thúc đẩy vẫn đang gia tăng, nếu tiến bộ công nghệ mô hình lớn không đạt kỳ vọng, không thể loại trừ rủi ro điều chỉnh chi tiêu vốn AI, từ đó ảnh hưởng đến nhu cầu.

Rủi ro giá lưu trữ giảm: Do giá lưu trữ tăng vọt, kênh lưu thông xuất hiện hiện tượng đầu cơ tích trữ, nếu đầu cơ quá mức ảnh hưởng đến nhu cầu hạ nguồn, có nguy cơ giá giảm.

Rủi ro tiến triển nghiên cứu và phát triển không đạt kỳ vọng: Các doanh nghiệp lưu trữ cần liên tục nâng cấp và đổi mới sản phẩm, nếu chọn sai chiến lược hoặc gây ra rủi ro thất bại trong nghiên cứu và phát triển.

04 Kết luận

Nhìn lại lịch sử ngành lưu trữ toàn cầu, mỗi lần có xung đột địa chính trị, đều sẽ gia tốc tái cấu trúc chuỗi cung ứng; mỗi lần có cách mạng công nghệ, đều sẽ sinh ra nhu cầu lưu trữ hoàn toàn mới.

Hiện tại, chúng ta đang đứng ở giao điểm của cuộc cách mạng AI và tái cấu trúc chuỗi cung ứng, lưu trữ chính là con đường cốt lõi mà cả hai làn sóng lớn này đều hướng tới.

Tất nhiên, bất kỳ khoản đầu tư nào trong lĩnh vực này cũng không thể suôn sẻ. Ngành lưu trữ vẫn phải đối mặt với những thay đổi trong chính sách thương mại nước ngoài, cạnh tranh ngành gia tăng, và tiến bộ công nghệ không đạt kỳ vọng, điều này cũng yêu cầu chúng ta phải liên tục theo dõi sự thay đổi của ngành, loại bỏ giả mạo và tìm ra những doanh nghiệp thực sự có khả năng cạnh tranh cốt lõi.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Gate Fun hot

    Xem thêm
  • Vốn hóa:$2.25KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.25KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.26KNgười nắm giữ:1
    0.14%
  • Vốn hóa:$2.25KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.27KNgười nắm giữ:2
    0.00%
  • Ghim