Lưu trữ đột nhiên gặp phải cú sốc lớn, nhưng AI vẫn chưa buông tay khỏi việc tranh giành hàng hóa

Chứng khoán hãy xem báo cáo nghiên cứu của các nhà phân tích Gold Kirin, có tính thẩm quyền, chuyên nghiệp, kịp thời, toàn diện—giúp bạn khai phá các cơ hội theo chủ đề giàu tiềm năng!

(Nguồn: China Fund News)

“Ở giai đoạn hiện nay, khóa năng lực sản xuất còn quan trọng hơn việc bàn giá.”

Tác giả: Ngưu Tư Nhược

Một tin tức kỹ thuật của Google về “giảm mức sử dụng bộ nhớ xuống còn 1/6” đã đổ một “cơn mưa lạnh” lên toàn bộ phân khúc lưu trữ trên toàn cầu.

Gần đây, Google đã cho ra mắt thuật toán nén TurboQuant. Thuật toán này, trong điều kiện không hy sinh độ chính xác của mô hình, đã giảm nhu cầu về không gian của “bộ nhớ đệm khóa–giá trị” (KV Cache)—phần tiêu tốn tài nguyên nhất trong giai đoạn suy luận AI—xuống còn 1/6 và đồng thời giúp tốc độ tính toán chú ý (attention) tăng 8 lần.

Ngay khi tin tức được tung ra, thị trường nhanh chóng diễn giải thành “sẽ tác động đến tổng nhu cầu đối với chip lưu trữ của ngành AI”, rồi nhanh chóng lan truyền sang thị trường vốn; cổ phiếu khái niệm chip lưu trữ suy yếu đồng loạt.

Song song đó, chủ đề “giá thanh RAM giảm như thác đổ” đã vọt lên top tìm kiếm nóng. Giá kênh lỏng lẻo, nhiễu động kỹ thuật và đợt điều chỉnh của cả nhóm ngành đan xen với nhau khiến thị trường không khỏi bắt đầu tự hỏi lại: chu kỳ thị trường lưu trữ lần này, liệu đã đi tới điểm ngoặt chưa?

Những dấu hiệu “lỏng ra” cục bộ từ phía kênh

Đợt giảm giá thanh RAM được thảo luận rộng rãi này diễn ra chủ yếu ở kênh giao ngay, nhắm nhiều hơn vào các cá nhân có nhu cầu tự lắp ráp máy.

Quy mô bản thân thị trường như vậy khá hữu hạn, nên biến động giá và tâm lý tiêu dùng nhạy cảm hơn. Nhà phân phối kênh vừa phải xem báo giá từ thượng nguồn, vừa phải cân nhắc liệu người dùng ở phía C có thực sự mua hay không.

Một chủ cửa hàng chuyên bán thanh RAM ở Hoa Cường Bắc cho phóng viên biết rằng, từ thứ Tư tuần trước, nhiều sản phẩm RAM đã bắt đầu giảm giá. Hiện tại, giá RAM 16G giảm từ khoảng 900 nhân dân tệ của tuần trước xuống khoảng 700 nhân dân tệ; giá RAM 32G cũng cơ bản giảm khoảng 300 nhân dân tệ.

Việc giá lao dốc và cổ phiếu sụt giảm mạnh quả thực tạo ra cảm giác “đỉnh của xu hướng” trong ngắn hạn. Theo nhận định của một số người trong ngành, điều này giống như một lần điều chỉnh tạm thời do mức tăng trước đó quá nhanh ở thị trường kênh, chứ không phải sự đảo chiều của xu hướng ngành.

“Mức tăng giá trước đó quá lớn khiến tâm lý chống lại sản phẩm lưu trữ giá cao của khách kênh ngày càng mạnh, khiến giao dịch thực tế trở nên khó khăn. Quan trọng hơn, phía thương mại ở kênh giao ngay muốn thu hồi vốn và hiện thực hóa lợi nhuận; phía thương mại bán ra nhiều thanh RAM DDR4 cấp thấp, tiếp tục gây sức ép và đè lên thị trường kênh.” Một nhà phân tích thị trường cho biết.

Còn nhìn từ thị trường hợp đồng thì lại là một bức tranh khác. Theo người này tiết lộ, trong quý 1 năm nay, giá hợp đồng của máy chủ và PC NAND, DRAM từ nhà sản xuất (nguyên bản) đều tăng theo kiểu gấp đôi.

Người này cho rằng hiện nay sản phẩm lưu trữ không thể đáp ứng hoàn toàn nhu cầu thị trường; vấn đề thiếu nguồn cung lưu trữ trong ngắn hạn khó có thể được cải thiện, vì vậy việc thị trường kênh điều chỉnh giá không làm thay đổi logic tăng trưởng toàn ngành lưu trữ.

“Không có RAM thì không có AI”

Hầu như cùng thời điểm đó, tại hội nghị thị trường bộ nhớ Trung Quốc MemoryS 2026 diễn ra ở Thâm Quyến, bầu không khí lại tràn ngập một tâm trạng hoàn toàn khác.

“Ai cũng hỏi tôi có hàng không; thậm chí chỉ cần có hàng, không hỏi giá.” Nhân viên bán hàng của một nhà triển lãm lưu trữ nói với phóng viên, cười khổ, “nhưng giờ chúng tôi cũng chỉ đáp ứng được khoảng ba đến bốn phần mươi nhu cầu; nếu gặp đơn có khối lượng quá lớn thì chỉ có thể gạt bỏ.”

Thị trường đang lo ngại nhu cầu hạ nhiệt, nhưng tại hiện trường hội nghị đỉnh cao của ngành, cảm nhận được vẫn là sự căng thẳng về nguồn cung. Trong hội trường chật kín, “ngành lưu trữ thiếu hàng còn phải thiếu bao lâu nữa” là một trong những chủ đề nóng nhất.

Tổng giám đốc thị trường flash là Đài Vĩ cho biết: “AI không chỉ là cơn gió ngọn sóng, mà là một cuộc cách mạng ở tầng nền; nó đang biến lưu trữ từ một khoản chi phí trong bảng BOM thành tài nguyên chiến lược cho cuộc đua AI, biến sản phẩm mang tính chu kỳ thành năng lực cạnh tranh cốt lõi của kinh tế số.”

Điều này không hề phóng đại.

Dù là huấn luyện, suy luận hay tinh chỉnh của mô hình lớn, hoặc các ứng dụng đa phương thức, mỗi khâu đều đẩy băng thông và dung lượng lưu trữ lên đến cực hạn. HBM cũng từ một sản phẩm cao cấp chỉ dành cho số ít đã trở thành “dầu mỏ” của kỷ nguyên AI; RAM DDR5 dung lượng lớn cũng từ cấu hình tùy chọn biến thành cấu hình tiêu chuẩn của máy chủ AI; SSD doanh nghiệp không chỉ đơn thuần là nơi chứa dung lượng, mà là chìa khóa để vượt qua nút thắt hiệu năng trong toàn bộ kiến trúc năng lực tính toán.

Đài Vĩ giải thích rằng khi mô hình lớn suy luận, cần lưu lại kết quả Key Value của từng lớp và từng Token để tránh tính lặp, rút ngắn thời gian phản hồi. Khi ngữ cảnh được kéo dài từ 4K Token lên 128K Token, nhu cầu dung lượng bộ nhớ đệm KV sẽ tăng gấp bội; rồi cộng thêm các yêu cầu đồng thời (high concurrency), quy mô nhu cầu sẽ nhanh chóng tăng lên, và chỉ dựa vào HBM đã khó có thể gánh chịu—ngày càng nhiều áp lực bắt đầu chuyển sang SSD NVMe.

“Chính vì vậy, nhu cầu SSD tối ưu cho tải suy luận AI tăng cực nhanh, eSSD trở thành thị trường ứng dụng NAND lớn nhất ở năm 2026.” Đài Vĩ dự đoán.

“Không có RAM thì không có AI.” Nhận định của CEO Phán Kiện Thành của Unigroup (Phison?) thậm chí còn thẳng thắn hơn. Theo ông, thuật toán nén mà Google tung ra không có nghĩa là nhu cầu lưu trữ sẽ sụp đổ tuyến tính. Ngược lại, công nghệ nén đồng nghĩa với chi phí của máy chủ giảm, số lượng xuất hàng tăng; đồng thời cũng có nghĩa người dùng có thể tạo ra nhiều Token hơn, kéo theo nhu cầu lưu trữ và gọi truy cập nhiều hơn.

Morgan Stanley cũng cho rằng, bằng cách giảm mạnh chi phí dịch vụ cho từng truy vấn, TurboQuant có thể chuyển các mô hình vốn chỉ có thể chạy trên các cụm đắt tiền ở đám mây về chạy tại chỗ, từ đó giảm hiệu quả đáng kể ngưỡng triển khai AI quy mô lớn; điều này có thể ngược lại còn thúc đẩy nhu cầu chung hơn nữa.

Đợi mở rộng sản lượng, nhưng thiếu hàng thì khó giải

“Dù hiện nay các nhà sản xuất gốc lưu trữ đã bắt đầu tăng đầu tư chi tiêu vốn mới và mở rộng công suất, nhưng chu kỳ mở rộng công suất của ngành lưu trữ kéo dài 18 đến 24 tháng; sớm nhất cũng phải đến năm 2027 mới có công suất mới được đưa ra.” Đài Vĩ nói với phóng viên rằng vấn đề thiếu nguồn cung lưu trữ trong ngắn hạn khó có thể được giải quyết.

Theo ông, đến năm 2026 sẽ không có bất kỳ sản phẩm lưu trữ AI mainstream nào trên toàn cầu đạt được cân bằng hoàn toàn cung–cầu; trọng tâm của ngành lưu trữ đã chuyển từ “xem ai rẻ hơn” sang “xem ai có thể lấy được hàng”.

“Ở giai đoạn hiện nay, khóa năng lực sản xuất còn quan trọng hơn việc bàn giá.” Đài Vĩ nói thẳng.

Một lãnh đạo của công ty dẫn đầu về bộ điều khiển lưu trữ là iGera (Hui Rong Ke Ji) cũng cho biết năm 2026 chưa phải thời điểm đen tối nhất; đến năm 2027 khoảng cách cung–cầu sẽ bị nới rộng. Bởi việc thiếu hàng vì tăng giá lần này không phải dao động chu kỳ đơn giản, mà là thay đổi mang tính cấu trúc do AI dẫn dắt—vì lượng dữ liệu khổng lồ tạo ra từ huấn luyện và suy luận AI đối với nhu cầu lưu trữ là chưa từng có.

Vừa chịu áp lực, vừa vươn lên

Vì thế, sự phân hóa thực tế hơn bắt đầu xuất hiện.

Đối với các thị trường tiêu dùng truyền thống như điện thoại và PC, việc giá lưu trữ tăng trước hết thể hiện thành áp lực chi phí. Một số nhà sản xuất lưu trữ đang đi theo lộ trình “tỷ lệ giá/hiệu năng”, cố gắng dùng ít bộ nhớ hơn để tạo trải nghiệm tương đương cao hơn.

Ví dụ, Jiāngbōlóng (Pang Loong?) đang cố gắng thúc đẩy việc triển khai toàn kịch bản cho AI ở cả phía PC và nhúng thông qua tích hợp sâu công nghệ bộ đệm HLC nâng cao với SPU và UFS. Vừa tối ưu trải nghiệm AI, vừa giảm nhu cầu dung lượng DRAM và chi phí của thiết bị đầu cuối; Phán Kiện Thành của Unigroup ra mắt Phison Hybrid AI SSD cùng công nghệ aiDAPTIV+. Dự kiến, công nghệ này có thể giảm hơn 50% lượng DRAM sử dụng, giúp chi phí kiểm soát được và suy luận cục bộ an toàn.

Trong khi đó, phía còn lại lại đang “đi lên” một cách đồng loạt—tài nguyên và công suất đang được ưu tiên chảy vào các sản phẩm công nghệ cao, giá trị cao, rào cản cao.

Trước đây, ánh đèn sân khấu của ngành AI tập trung vào “huấn luyện”. Các cụm điện toán đúng là ấn tượng về thông lượng, nhưng nhu cầu thường mang tính theo giai đoạn. Ngày nay, trọng tâm của ngành đang chuyển toàn diện sang “suy luận”—một “hố sâu vô đáy” có tần suất cao hơn, chi tiết hơn, và gắn sát với luồng giao dịch thương mại thực tế hơn.

Theo dữ liệu mới nhất từ Cục dữ liệu quốc gia, trong tháng 3 năm nay, lượng gọi Token bình quân/ngày của Trung Quốc vượt 140 nghìn tỷ; trong gần 2 năm, tốc độ tăng trưởng vượt hơn 1000 lần. Theo cách nhìn của Hoàng Nhân Huấn, AI dạng tác nhân (agentic AI) có khả năng làm tăng lượng tiêu thụ Token lên 1000 lần, từ đó hình thành “khoảng trống năng lực tính toán” mà ông gọi là “算力真空”.

Đài Vĩ nói thẳng: “Chúng tôi có thể xác nhận một câu—ai có thể giải quyết ‘mức tiêu hao điện năng và độ trễ khi vận chuyển dữ liệu trong kỷ nguyên AI’, người đó sẽ xác định được thập kỷ tiếp theo. Lưu trữ sẽ bước vào một siêu chu kỳ được dẫn dắt bởi AI.”

Trương Thực Hoàn, Phó tổng giám đốc điều hành kiêm Trưởng nhóm phát triển nền tảng giải pháp của Samsung Electronics, cho biết bộ nhớ hiệu năng cao không còn là lựa chọn có cũng được mà không có cũng chẳng sao, mà là nền tảng then chốt quyết định hiệu suất ra quyết định và quy mô của hệ thống. Xuất phát từ phán đoán đó, Samsung đang triển khai SSD thể rắn PCIe Gen6 PM1763 và dự kiến giai đoạn 2026–2027 sẽ tung ra các bộ điều khiển EDSFF mật độ cao hơn nhằm nâng cao dung lượng và băng thông mỗi máy.

Người phụ trách mảng SSD của Yangtze Memory là Đàm Hồng đề cập rằng cuộc đua AI đã đi từ giai đoạn huấn luyện “tích dần dày lên” sang giai đoạn suy luận “phát hành mỏng mảnh”, tức là nhu cầu băng thông lưu trữ đang bị thắt chặt nghiêm trọng, kìm hãm việc giải phóng năng lực tính toán. Hiện khả dụng của cụm GPU chỉ khoảng 50%.

Theo ông, lối phá cục nằm ở sự phối hợp tính toán–lưu trữ. Ở phía huấn luyện, có thể dựa vào checkpoint lưu trữ bằng QLC eSSD dung lượng lớn để nâng hiệu suất GPU; ở phía suy luận, thông qua bộ nhớ đệm theo tầng của eSSD để gánh phần quản lý trạng thái ngữ cảnh (KV Cache). Với các tình huống như vậy, Yangtze Memory đã cho ra mắt nhiều mẫu eSSD doanh nghiệp Gen5.

Đối với các nhà sản xuất lưu trữ, câu hỏi sát hạch thực sự không phải là có thể tăng giá hay không, mà là có thể đứng ở lớp giá trị cao hơn hay không.

Từ cuộc chiến giá sang cuộc chiến giá trị, từ sản phẩm đơn lẻ đến giải pháp toàn tầng, từ phụ thuộc vào năng lực tính toán đến “đòn quyết định thắng bại trong AI”… Trong cuộc đua mà AI đang viết lại luật chơi này, đôi lúc giá bán lẻ có lỏng ra, chỉ là gợn sóng trên mặt nước; còn sâu hơn bên dưới, quân bài vẫn khan hiếm—và cực kỳ đắt đỏ.

Biên tập: Hoàng Mai Biên tập: Vương Nguyệt Duyệt: Trần Sư Dương

Khối lượng thông tin khổng lồ, diễn giải chính xác—tất cả đều có trên ứng dụng Sina Finance

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Gate Fun hot

    Xem thêm
  • Vốn hóa:$2.23KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.26KNgười nắm giữ:2
    0.07%
  • Vốn hóa:$2.22KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.23KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.23KNgười nắm giữ:0
    0.00%
  • Ghim