AI đồng thời tạo ra sự thiếu hụt và thừa thãi bộ nhớ

robot
Đang tạo bản tóm tắt

3月29日, Huaqiangbei và thị trường bán lẻ của Mỹ đồng thời trải qua một đợt giảm giá theo kiểu “gãy thẳng đứng” của giá thanh bộ nhớ (RAM). Bộ kit Corsair 32GB DDR5-6400 từ 490 USD giảm xuống còn 380 USD, mức giảm trong một ngày là 22%. Trong nước, bộ kit DDR5 xung cao 32GB giảm 800 nhân dân tệ trong một tuần; các nhà phân phối hoảng loạn bán tháo theo phản ứng dây chuyền, có đại lý nói “chỉ trong một ngày đã rơi hơn một trăm đồng”.

Nhưng nếu đặt con số này trên một trục thời gian dài hơn, bức tranh hoàn toàn khác: dù đã giảm xong, giá DDR5 hiện tại vẫn gấp 4 lần vào tháng 7/2025. Đây là một lần “lệch cung-cầu” chính xác trong chuỗi công nghiệp AI: cùng một lực lượng, trước tiên tạo ra tình trạng thiếu hàng, rồi lại tạo ra nỗi sợ dư thừa.

Lúc lên lúc xuống: tăng 540% trong 8 tháng, giảm 22% trong 1 tháng

Tháng 7/2025, một bộ kit DDR5-6000 32GB phổ biến trên thị trường bán lẻ Mỹ chỉ cần 77 USD. Đến tháng 1/2026, cùng một bộ kit này đã vọt lên 490 USD. Trong 8 tháng, mức tăng là 540%.

Việc tăng giá không phải do người tiêu dùng đột nhiên điên cuồng nâng cấp máy tính. Theo dữ liệu của TrendForce, giá hợp đồng DRAM trong quý 1/2026 tăng 90%-95% theo quý; trong đó mức tăng của PC DRAM vượt 100%, đều lập mức tăng mạnh nhất theo quý kể từ khi có thống kê. Thúc đẩy tất cả những điều này là nhu cầu khát khao đối với một loại bộ nhớ đặc biệt từ việc xây dựng hạ tầng AI.

Rồi vào ngày 25/3, Google công bố một thuật toán nén có tên TurboQuant. Bốn ngày sau, giá bộ nhớ sụp đổ.

Công suất đi đâu rồi? HBM đã “ăn” hết thanh RAM của bạn

Để hiểu đợt tăng giá này, cần nắm một thông số kỹ thuật then chốt. HBM (bộ nhớ băng thông cao, loại bộ nhớ chuyên dụng cho chip AI của NVIDIA) có diện tích wafer tiêu hao cho mỗi GB gấp 3 lần so với DDR5 thông thường. Theo báo cáo của Tom’s Hardware, điều này có nghĩa là cùng một wafer, chỉ có thể sản xuất được 1/3 dung lượng DDR5 khi làm HBM.

Samsung, SK Hynix và Micron—ba nhà sản xuất bộ nhớ lớn—đã đưa ra lựa chọn hợp lý trước mức tỷ suất lợi nhuận cao của HBM: chuyển tối đa 40% công suất wafer của quy trình chế tạo tiên tiến sang sản xuất HBM. Theo dữ liệu của TrendForce, đến quý 1/2026, tỷ suất lợi nhuận của DDR5 dự kiến lần đầu tiên vượt HBM3e, phản ánh mức độ cung của bộ nhớ tiêu dùng đã bị “bóp nghẹt” đến mức nào.

Lựa chọn của Micron là quyết liệt nhất. Tháng 12/2025, công ty này thông báo đóng cửa thương hiệu tiêu dùng đã vận hành 29 năm Crucial, hoàn toàn rút khỏi thị trường bộ nhớ và lưu trữ cho người dùng phổ thông, chuyển toàn diện sang khách hàng doanh nghiệp và AI. Theo thông cáo của Micron, tổng doanh thu năm tài chính 2025 đạt 37,38 tỷ USD, trong đó trung tâm dữ liệu và ứng dụng AI chiếm 56% tổng doanh thu. Thị trường tiêu dùng—không còn đáng để làm nữa.

Công suất HBM của SK Hynix đã được bán hết đến cuối năm 2026. Samsung dự kiến nâng công suất HBM theo tháng từ 170.000 wafer lên 250.000 wafer vào cuối năm 2026. Nhà máy wafer mới (Samsung P4L và SK Hynix M15X) sớm nhất phải đến 2027-2028 mới đạt sản xuất đại trà. Nói cách khác, thiếu hụt cung của DRAM cấp tiêu dùng là mang tính cấu trúc, không thể được cải thiện chỉ trong một hai quý.

Lật ngược cục diện, SK Hynix phá vỡ “ngai chủ” 40 năm của Samsung

Việc chuyển dịch công suất này còn viết lại bản đồ quyền lực trong ngành bộ nhớ. Theo dữ liệu của TrendForce, ở quý 2/2025, SK Hynix—nhờ gắn kết sâu với NVIDIA—đã giành 62% thị phần HBM, trong khi Samsung chỉ 17% và Micron là 21%.

Hơn nữa, bước ngoặt còn thể hiện trên phương diện doanh thu. Theo báo cáo quý 3/2025 của TrendForce, SK Hynix lần đầu tiên vươn lên dẫn đầu về doanh thu DRAM theo quý với 13,75 tỷ USD; Samsung theo sau với 13,50 tỷ USD. Khoảng cách giữa hai bên chỉ là 250 triệu USD, nhưng đây là lần đầu tiên trong gần 40 năm Samsung mất vị trí số 1 về doanh thu bộ nhớ. Theo báo cáo của CNBC, lợi nhuận hoạt động cả năm 2025 của SK Hynix cũng lần đầu tiên vượt Samsung.

Lợi thế đi trước của HBM đem lại cho SK Hynix đủ “quân bài”, nhưng cuộc đua này vẫn chưa kết thúc. Samsung đang dồn toàn lực để bám sát tiến độ sản xuất đại trà HBM4; Micron dù từ bỏ thị trường tiêu dùng nhưng tốc độ tăng trưởng doanh thu ở mảng doanh nghiệp và AI (quý 3 so với quý trước +53,2%) là nhanh nhất trong ba nhà.

Một thuật toán đã lay chuyển logic tăng giá như thế nào?

Ngày 25/3, Google trình bày thuật toán TurboQuant tại ICLR 2026. Thuật toán này thực hiện một việc: nén bộ nhớ đệm KV (key-value cache, phần chiếm nhiều bộ nhớ nhất trong quá trình suy luận của mô hình ngôn ngữ lớn) từ độ chính xác FP16 xuống 3-bit, làm giảm dung lượng bộ nhớ ít nhất 6 lần; đồng thời đạt gia tốc tính toán attention tối đa 8 lần trên GPU H100. Theo blog nghiên cứu của Google, trong năm bài benchmark bối cảnh dài như Needle-in-a-Haystack, mức suy giảm về độ chính xác là bằng 0.

Thị trường nhanh chóng tính toán. Nếu TurboQuant hoặc các thuật toán tương tự được các công ty AI chủ lực ứng dụng rộng rãi, thì nhu cầu gia tăng đối với DRAM cho suy luận AI sẽ giảm mạnh. Và câu chuyện cốt lõi hỗ trợ đà tăng giá bộ nhớ trong nửa năm qua chính là “hạ tầng AI đã tiêu thụ quá nhiều công suất bộ nhớ”.

Bốn ngày sau, niềm tin của kênh phân phối sụp đổ.

Cần lưu ý rằng TurboQuant nhắm vào phía suy luận của AI, chứ không phải nhu cầu HBM ở phía huấn luyện. Quan hệ cung-cầu của HBM trong ngắn hạn sẽ không thay đổi chỉ vì một thuật toán tối ưu cho suy luận. Nhưng thị trường không phải lúc nào cũng phân biệt rõ hai mảng này. Theo báo cáo của Sina Finance, ở giai đoạn đầu trước khi giá sụt mạnh, các kênh phân phối trong nước đã đổ xô vào việc gom hàng “ngoài vòng” do tăng giá; giá cao đã khiến doanh số bán lẻ giảm hơn 60%, và việc bán tháo theo hiệu ứng dây chuyền khi chuỗi vốn căng thẳng đã khuếch đại mức sụt giảm.

Một chuỗi ngành AI, đồng thời tạo ra cả tình trạng thiếu hụt bộ nhớ lẫn nỗi sợ dư thừa. Công suất vật lý của HBM bị “bóp chặt” khiến bộ nhớ cấp tiêu dùng không đủ cung; hiệu suất thuật toán của TurboQuant đột phá khiến kỳ vọng về nhu cầu bộ nhớ AI sụt giảm mạnh. Việc “tạo ra” tăng giá và “tạo ra” sập giá là do cùng một lực lượng.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim