Chứng khoán CITIC: Liên tục lạc quan về xu hướng tăng trưởng sáng tạo trong lưu trữ

Công ty chứng khoán Trung Tín trong báo cáo nghiên cứu cho rằng, thời đại Agent AI có dung lượng lưu trữ (storage) làm cốt lõi, thúc đẩy ngành lưu trữ chuyển đổi mô hình theo chu kỳ dài. Về cung-cầu, AI suy luận khiến mức tiêu hao Token tăng vọt, KV Cache theo đó tăng tuyến tính; nhu cầu bùng nổ và việc mở rộng sản xuất của các nhà sản xuất gốc (original factory) không khớp với nhau khiến tình trạng thiếu hàng trở thành bình thường hóa. Dự kiến tình trạng cung không đủ cầu sẽ tiếp tục đến năm 2027, và việc tăng giá sẽ kéo dài suốt cả năm 2026. Về mặt kỹ thuật, trong bối cảnh HBM và DRAM cực kỳ thiếu hụt và chi phí cao, các nhà sản xuất chia sẻ các giải pháp đổi mới NAND, qua đó chia sẻ áp lực lên nhu cầu dung lượng bộ nhớ hiển (vram) (显存). Chúng tôi tiếp tục đánh giá cao xu hướng tăng trưởng nhờ đổi mới trong ngành lưu trữ.

Toàn văn như sau

Lưu trữ | Từ Hội nghị thượng đỉnh thị trường Flash để nhìn xu hướng phát triển lưu trữ

Thời đại Agent AI lấy dung lượng lưu trữ làm cốt lõi, thúc đẩy ngành lưu trữ bước vào sự chuyển đổi mô hình theo chu kỳ dài. Về cung-cầu, AI suy luận khiến mức tiêu hao Token tăng vọt, KV Cache theo đó tăng tuyến tính; nhu cầu bùng nổ và việc mở rộng sản xuất của các nhà sản xuất gốc không khớp với nhau khiến tình trạng thiếu hàng trở thành bình thường hóa, dự kiến cung không đủ cầu sẽ tiếp tục đến năm 2027, và việc tăng giá sẽ kéo dài suốt cả năm 2026. Về mặt kỹ thuật, trong bối cảnh HBM và DRAM cực kỳ thiếu hụt và chi phí cao, các nhà sản xuất chia sẻ các giải pháp đổi mới NAND, qua đó chia sẻ áp lực lên nhu cầu dung lượng bộ nhớ hiển (显存). Chúng tôi tiếp tục đánh giá cao xu hướng tăng trưởng nhờ đổi mới trong ngành lưu trữ.

Hội nghị thượng đỉnh thị trường Flash Trung Quốc năm 2026 được tổ chức, tập trung vào cơ hội đổi mới lưu trữ và nâng cấp chuỗi công nghiệp trong thời đại AI.

Ngày 27 tháng 3 năm 2026, CFMS MemoryS 2026 - đại hội lưu trữ thường niên của ngành toàn cầu - được tổ chức tại Thâm Quyến. Là một hội nghị cấp độ “chuẩn mực định hướng” của ngành, kỳ sự kiện lần này lấy chủ đề cốt lõi “Xuyên qua chu kỳ, giải phóng giá trị”, tập trung sâu vào đổi mới công nghệ và sự phối hợp nâng cấp của chuỗi công nghiệp. Sự kiện thu hút hàng chục doanh nghiệp hàng đầu toàn cầu tham gia như Samsung Electronics, Công nghệ Hợp Hi (慧荣科技), Kioxia, Solidigm, Intel, Tencent Cloud,…, bao phủ toàn bộ chuỗi công nghiệp từ nhà sản xuất chip nhớ gốc, thiết kế bộ điều khiển (controller), sản xuất module đến dịch vụ trên đám mây. Hội nghị diễn ra theo song song hai đường: diễn đàn cấp cao và triển lãm kỹ thuật; trong quá trình diễn tiến còn bao gồm triển vọng xu hướng ngành, tập trung vào sự bùng nổ nhu cầu về dung lượng lưu trữ dưới mức token/KV Cache tăng mạnh trong thời đại Agent AI. Hội nghị mở ra các thảo luận tiên phong về những đổi mới lưu trữ được thúc đẩy bởi AI như bước đột phá công nghệ PCIe 5.0/6.0 SSD, QLC dung lượng siêu lớn và các biến đổi sáng tạo lưu trữ khác, đồng thời trình diễn đồng bộ hơn 100 hạng mục sản phẩm đổi mới.

▍ AI suy luận thúc đẩy bùng nổ nhu cầu lưu trữ, tình trạng lệch pha mang tính cấu trúc trở thành thường lệ; dự kiến cung không đủ cầu ít nhất sẽ kéo dài đến năm 2027, và việc tăng giá sẽ diễn ra suốt cả năm 2026.

Phía nhu cầu: Theo dữ liệu của thị trường Flash Trung Quốc CFM, năm 2026 lượng xuất xưởng máy chủ tăng trưởng so với cùng kỳ +15%; tỷ trọng máy chủ AI trong tổng lượng xuất xưởng máy chủ sẽ vượt 20%. Khi các mô hình lớn (large model) chuyển từ giai đoạn huấn luyện sang giai đoạn suy luận, ứng dụng Agent bùng nổ khiến mức tiêu hao Token tăng mạnh. Khi độ dài chuỗi tăng từ 1k lên 128k token, dung lượng KV Cache chiếm dụng tăng từ 0,5GB lên 64GB (BF/FP16, mỗi yêu cầu). Với bối cảnh “ngữ cảnh dài” (long context) + “đồng thời cao”, nhu cầu lưu trữ theo token/khối lượng truy cập đồng thời sẽ tăng bùng nổ theo tuyến tính. CFM dự đoán dung lượng HBM trong các năm 2025/2026 lần lượt tăng trưởng so với cùng kỳ +90%/35% trở lên; đồng thời KV Cache đi xuống (downward) kết hợp với tình trạng thiếu cung HDD làm nhu cầu tràn sang thúc đẩy eSSD trở thành khách hàng tiêu thụ NAND lớn nhất trong năm 2026 (tỷ trọng tăng lên 37%).

Phía cung: Việc lệch pha chu kỳ mở rộng sản xuất, việc thiếu hàng và tăng giá sẽ kéo dài. Các nhà sản xuất bộ nhớ (lưu trữ) nhìn chung áp dụng chiến lược giữ vững giá; công suất tiên tiến được ưu tiên đầu tư vào các sản phẩm lưu trữ AI có biên lợi nhuận gộp cao. Theo CFM, tỷ trọng công suất DRAM tương đối cao cấp gồm HBM/DDR5/LP5X/6 tăng từ dưới 50% vào năm 2024 lên 85%+ vào năm 2026; công suất tiến trình trưởng thành và công suất phục vụ tiêu dùng bị tiếp tục bị “bóp nghẹt”. Lượng tồn kho của ngành từ 2023 (10~12 tuần), 2024 (8~10 tuần) giảm xuống 4 tuần vào năm 2026, rơi xuống dưới mức an toàn lịch sử. Chu kỳ mở rộng sản xuất của ngành lưu trữ kéo dài 18~24 tháng; không thể xuất hiện bước ngoặt cung vào 26H2. Công ty Hợp Hi (慧荣科技) cho rằng năm 2027 mới là “thời điểm tăm tối” của tình trạng thiếu hàng lưu trữ. Từ 25H2, giá lưu trữ bắt đầu bước vào mức tăng kiểu sử thi; CFM dự đoán DRAM và NAND ASP sẽ tiếp tục tăng trong suốt cả năm 2026. Thời đại AI suy luận lấy dung lượng lưu trữ làm lõi, ngành lưu trữ bước vào chuyển đổi mô hình theo chu kỳ dài; cho tăng trưởng siêu cấp, không phải chỉ là cú bật ngược theo chu kỳ.

▍ Chuỗi công nghiệp lưu trữ tăng tốc tái cấu trúc giá trị.

Tại đại hội GTC gần đây, Nvidia nhấn mạnh đưa ra “Token factory economics” (kinh tế học “nhà máy Token”). Ý nghĩa cốt lõi ở chỗ củng cố vị trí chiến lược của lưu trữ trong cơ sở hạ tầng AI, đồng thời cũng hàm ý trần lợi nhuận của ngành lưu trữ sẽ được mở ra lâu dài. Theo dữ liệu CFM, ASP của sản phẩm eSSD ở 26Q1 đã đạt hơn gấp 2 lần ASP của NAND cấp tiêu dùng. Đối với các nhà sản xuất bộ nhớ gốc, trọng tâm là nâng cấp chất liệu (medium) và tái cấu trúc kiến trúc hệ thống ở cấp độ nền tảng; bài thuyết trình tại diễn đàn lần này chủ yếu tập trung vào thị trường cấp doanh nghiệp. Đối với các nhà cung cấp giải pháp lưu trữ, trọng tâm ngành chuyển từ “xem ai rẻ hơn” sang “xem ai lấy được hàng”; đồng thời các nhà cung cấp hàng đầu như Phison đang tăng tốc chuyển đổi sang “module tùy biến giá trị gia tăng cao” được trang bị năng lực bộ điều khiển (controller) tự nghiên cứu (self-developed), và mở rộng SSD cấp doanh nghiệp để một lần nữa định nghĩa lại giá trị của lưu trữ, thoát khỏi mô hình phụ thuộc truyền thống vào tồn kho giá thấp.

▍ Xu hướng lưu trữ AI đám mây (cấp doanh nghiệp): Bùng nổ QLC dung lượng lớn và tiến hóa nhanh của giao diện, tái tạo động cơ tính toán.

AI đang tăng tốc chuyển từ giai đoạn “huấn luyện” sang giai đoạn “suy luận”. Tỷ lệ giữa máy chủ suy luận và máy chủ huấn luyện trong tương lai dự kiến có thể lên đến 10:1 đến 50:1. Hiện nay, do bị giới hạn bởi nút thắt băng thông lưu trữ, mức khả dụng của các cụm GPU (tỷ lệ sử dụng) chỉ khoảng 46% đến 50%. Việc nâng cấp bộ nhớ hiển (VRAM) là nhu cầu cốt lõi; đồng thời tại hội nghị lần này, nhiều nhà sản xuất chia sẻ các chức năng phân bổ lại (function reallocation) cho sự phối hợp giữa tính toán và lưu trữ (cooperation between compute and storage). Vai trò của eSSD đang chuyển từ “bộ chứa dữ liệu thụ động” sang “động cơ tính toán” cốt lõi và “lớp bộ nhớ mở rộng”: ở phía huấn luyện, nhờ eSSD QLC dung lượng siêu lớn để lưu Checkpoint, có thể nâng cao đáng kể hiệu suất vận hành của GPU; ở phía suy luận, eSSD thông qua bộ nhớ đệm theo lớp (layered cache) KV Cache để xử lý các nhiệm vụ như quản lý trạng thái ngữ cảnh khổng lồ, truy vấn cơ sở dữ liệu vector và tải phân mảnh mô hình. Dữ liệu đo thực tế cho thấy, khi dỡ KV cache lên SSD và loại bỏ tính toán prefill, có thể giảm thời gian tạo token đầu tiên (TTFT) tới 41 lần. Lưu trữ cấp doanh nghiệp đang thể hiện các xu hướng kỹ thuật sau:

Trước nhu cầu tràn bộ nhớ đệm của lượng dữ liệu AI khổng lồ và KV Cache, QLC mật độ cao trở thành môi chất (medium) then chốt, và các giải pháp QLC dung lượng siêu lớn theo mức trăm TB là lựa chọn hàng đầu. Kioxia (245,76TB), Đại Phổ Vi (大普微) (245TB) và SanDisk (SN670) (lên tới 256TB) cũng lần lượt trình bày các sản phẩm QLC dung lượng siêu lớn vượt mốc hai trăm TB, tối ưu mạnh hiệu suất sử dụng không gian và TCO.

Chip điều khiển hướng tới “phối hợp mềm-dẻo (soft-hard)”, bù đắp điểm yếu của môi chất. Đối với áp lực băng thông và thao tác đọc/ghi ngẫu nhiên tần suất cao do KV Cache trong kịch bản suy luận, chip điều khiển đang chủ động nâng cấp. PingTouGe ZhenYue 510 (平头哥镇岳510) hỗ trợ nguyên sinh giao thức ZNS và phối hợp ở cấp hệ thống, hỗ trợ QLC thương mại hóa theo quy mô; lũy kế xuất xưởng hơn 500.000 chip. Unic (联芸科技) thì đưa vào các công nghệ như động cơ tăng tốc KV và prefetch dự đoán, khiến bộ điều khiển từ “người vận chuyển dữ liệu” trở thành một bộ “điều phối nguồn lực thông minh” chủ động.

Tăng tốc lặp đại (iterative) cho giao diện và đổi mới làm mát bằng chất lỏng (liquid cooling), thích ứng cho các siêu cụm GPU tới 100.000 thẻ. Hướng tới các cụm nghìn thẻ, vạn thẻ và thậm chí tới mười vạn thẻ, đối mặt thách thức về thông lượng dữ liệu khổng lồ và phát nhiệt mật độ cao. Samsung trình diễn SSD PCIe 6.0 kênh 16 (16-channel) PM1763; hiệu năng đầu vào/đầu ra tăng vượt bậc 2,0 lần. Bộ điều khiển PCIe Gen6 “Lhotse” của FADU đã tape-out (đã “chảy mạch”/ghi thiết kế vào sản xuất), hiệu năng đọc tuần tự dự kiến đạt 28,5GB/s.

▍ Xu hướng lưu trữ AI đầu cuối (cấp tiêu dùng): AI tăng tốc ở phía thiết bị triển khai thực tế, hợp nhất tính toán và lưu trữ để phá vỡ nút thắt chiếm dụng bộ nhớ.

Môi trường phía thiết bị đầu cuối rất khắt khe về chi phí BOM phần cứng, công suất hệ thống và việc sử dụng bộ nhớ DRAM; do đó, thông qua “tích hợp lưu trữ và tính toán” (存算融合), cơ chế điều phối thông minh phần mềm/phần cứng và các kỹ thuật bộ nhớ đệm tiên tiến, việc chuyển áp lực suy luận từ bộ nhớ (DRAM) sang bộ nhớ flash (NAND) trở thành một bổ sung quan trọng để vượt qua nút thắt triển khai mô hình lớn (large model) trên thiết bị đầu cuối hiện nay.

AI PC và mô hình lớn cục bộ (local large models): Công nghệ Hybrid (lai) giảm áp lực bùng nổ nhu cầu dung lượng DRAM. Khi chạy các mô hình lớn với hàng chục tỷ hoặc hàng trăm tỷ tham số trên thiết bị đầu cuối, bộ nhớ là một bài toán thử thách lớn. JiangboLong (江波龙) giới thiệu một đơn vị xử lý lưu trữ (storage processing unit) tích hợp SPU 5nm và một “tác nhân lưu trữ” iSA; trong quá trình tối ưu và xác nhận liên hợp, đã đạt triển khai cục bộ mô hình 397B trên máy PC, đồng thời trong kịch bản ngữ cảnh 256K làm giảm gần 40% mức chiếm dụng DRAM; Phison cũng giới thiệu Phison Hybrid AI SSD và công nghệ aiDAPTIV+, dự kiến có thể giảm hơn 50% lượng DRAM sử dụng, giúp chi phí kiểm soát được và suy luận cục bộ an toàn.

Ô tô thông minh và điện toán biên: Tiến tới kiến trúc “bể tập trung (central pooling)” và nền tảng thống nhất. Trí tuệ thể xác (embodied intelligence) và trí lái thông minh cấp cao đặt ra yêu cầu phối hợp toàn cục cho kiến trúc nền tảng. Công ty Xpeng (小鹏汽车) nêu rõ, với năng lực tính toán hiện cao nhất tới 2250 TOPS, băng thông DRAM đã trở thành nút thắt cốt lõi cho độ trễ suy luận; kỷ nguyên xe với LPDDR6 theo tiêu chuẩn ô tô sắp đến, và bộ nhớ NAND trên xe đang chuyển từ mô hình các “đảo phân vùng” sang kiến trúc bể tập trung và được định nghĩa bằng phần mềm.

Điện thoại thông minh và AIoT (Internet vạn vật thông minh): Giao diện tốc độ cao và công nghệ bộ nhớ đệm tiên tiến đi sâu xuống. Nhằm đáp ứng yêu cầu về tốc độ phản hồi và thời lượng pin đối với thiết bị di động và thiết bị đeo mới nổi, Công nghệ Hợp Hi (慧荣科技) sắp ra mắt bộ điều khiển UFS 4.1 thế hệ mới SM 2755 và tăng tốc bố trí cho thị trường AIoT như đồng hồ thông minh/kính thông minh; SanDisk sử dụng công nghệ SmartSLC cache, đạt chạy UFS 4.1 thông lượng cao với mức công suất chỉ khoảng 2W; JiangboLong thì thúc đẩy triển khai công nghệ HLC advanced cache ở phía thiết bị nhúng để giảm chi phí BOM của thiết bị đầu cuối.

▍ Các yếu tố rủi ro:

Rủi ro kinh tế vĩ mô toàn cầu u ám; nhu cầu ở hạ nguồn không đạt kỳ vọng; đổi mới không đạt kỳ vọng; rủi ro do thay đổi môi trường công nghiệp quốc tế và tình trạng gia tăng xung đột thương mại; tiến độ nâng cấp năng lực tính toán không đạt kỳ vọng; capex của các nhà cung cấp dịch vụ đám mây không đạt kỳ vọng, v.v.

▍ Chiến lược đầu tư:

Chúng tôi đánh giá cao xu hướng của ngành “lưu trữ và tính toán” dưới sự nâng cấp dung lượng lưu trữ trong thời đại Agent AI; với “cận bộ nhớ (near-memory) tính toán” trong giai đoạn độ nóng cao, chúng tôi đánh giá cao chuỗi công nghiệp HBM và CUBE. Đồng thời, trong bối cảnh thiếu hụt lưu trữ, toàn bộ nhóm lưu trữ chủ đạo đến lưu trữ phân khúc (to lợi nhuận/đặc thù) đều thiếu hàng và tăng giá; nhiều nhà sản xuất phản hồi rằng mức tăng ở 26Q2 so với quý trước vẫn tương tự. Chúng tôi dự kiến tình trạng cung không đủ cầu của ngành ít nhất sẽ kéo dài đến cuối năm 2027. Khuyến nghị trọng tâm: các công ty module lưu trữ (khả năng bùng nổ hiệu quả ngắn hạn mạnh); các nhà sản xuất lưu trữ gốc và các công ty thiết kế bám sát nhà sản xuất gốc.

(Nguồn: Jiemian News)

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim