55TB biến thành 28TB? Tin đồn và hoảng loạn đằng sau việc giảm một nửa bộ nhớ Rubin

Question

Viết bài: Nghiên cứu xu hướngSáng ngày 4 tháng 6, tổ chức nghiên cứu độc lập có ảnh hưởng nhất trong ngành bán dẫn SemiAnalysis đã phát hành một bản tin sáng.Thông tin cốt lõi chỉ có một câu: dung lượng DRAM SOCAMM của mỗi khung máy Vera Rubin NVL72 của Nvidia có thể giảm từ dự kiến trước đó khoảng 55TB xuống còn khoảng 28TB. Hầu hết các hệ thống Rubin sẽ sử dụng module SOCAMM 96GB, thay vì dự kiến phổ biến trên thị trường là 192GB như trước.Sau khi tin tức lan truyền, phản ứng của thị trường đơn giản và thẳng thừng: nhu cầu bộ nhớ giảm một nửa, ảnh hưởng tiêu cực đến Micron. MU trong phiên giao dịch đã giảm hơn 10%, từ mức đỉnh lịch sử 1089 USD ngày hôm trước nhanh chóng rơi xuống 971 USD, mất hơn nghìn tỷ USD giá trị thị trường trong ngày.Sự hoảng loạn là có thật, vấn đề là, hướng của sự hoảng loạn có đúng không?Hãy tính rõ ràng trước đãVera Rubin NVL72 là khung siêu máy tính AI cao cấp thế hệ tiếp theo của Nvidia. Mỗi khung chứa 72 GPU Rubin và 36 CPU Vera. Phần GPU sử dụng HBM4, mỗi cái 288GB, tổng khoảng 20.7TB cho toàn khung, phần này không thay đổi. Thay đổi là ở phía CPU.Mỗi CPU Vera có 8 khe SOCAMM, mỗi khe có thể cắm các module dung lượng khác nhau. Thông số chính thức Nvidia công bố tại CES 2026 là "mỗi CPU Vera hỗ trợ tối đa 1.5TB LPDDR5X", tương ứng với cấu hình đầy đủ 8 module 192GB. 36 CPU sẽ là khoảng 54TB.SemiAnalysis lần này nói rằng: cấu hình thực tế xuất xưởng khả năng cao sẽ không đầy đủ. Phần lớn hệ thống sẽ dùng module 96GB, 8×96GB=768GB mỗi CPU, 36 CPU là khoảng 28TB.Từ 55TB xuống còn 28TB, giảm gần một nửa dung lượng, tiêu đề bài viết gọi là "nhu cầu bộ nhớ giảm một nửa".Nhưng con số này, thị trường đã tính sai một biến số quan trọng.Lỗ hổng trong logic hoảng loạnThứ nhất, SOCAMM là thiết kế khe cắm, không phải hàn chết.Đây là chi tiết kỹ thuật dễ bị bỏ qua nhất trong toàn bộ câu chuyện. Khác với LPDDR được hàn cố định trên bo mạch chủ của GB300 Blackwell Ultra, nền tảng Vera Rubin sử dụng module SOCAMM2 theo tiêu chuẩn JEDEC, có thể tháo rời, thay thế nóng, nâng cấp sau này. Hôm nay cắm 96GB, ngày mai khách hàng cần, tháo ra cắm 192GB hoặc 256GB, giống như đổi RAM vậy.Nvidia đã nhấn mạnh thiết kế này tại CES 2026: toàn bộ khay tính toán từ 2 giờ lắp ráp rút ngắn còn 5 phút. Modular, dễ bảo trì, dễ nâng cấp là một trong những bước tiến lớn về kiến trúc của Vera Rubin so với Blackwell.Việc giảm cấu hình ban đầu không đồng nghĩa với nhu cầu vĩnh viễn biến mất. Nó giống như chiến lược "lên tàu trước rồi mua vé sau".Thứ hai, lý do giảm dung lượng không phải là không cần nữa, mà là "không đủ dùng".Dylan Patel, sáng lập SemiAnalysis, đã nói một câu rất sâu sắc trên Twitter: "Tôi thích một điều, đó là những người chia sẻ lại báo cáo của chúng tôi, phần lớn nội dung trong đó họ đều bỏ qua. Điều này thường xuyên xảy ra."Các bình luận trên Digg về tin này cũng rất rõ ràng: 77.8% cho rằng việc lan truyền lại là tiêu đề giật gân, bóp méo nội dung.Điều bị bỏ qua là gì? Là bối cảnh.Năm 2026, nguồn cung LPDDR5X toàn cầu cực kỳ căng thẳng. Micron tại hội nghị Wolfe cuối tháng 5 đã rõ ràng nói rằng, nhu cầu bộ nhớ vượt quá khả năng cung ứng rõ rệt, dự kiến tình trạng này sẽ kéo dài đến sau năm 2026. Trong năm tài chính 2026, toàn bộ sản lượng HBM của Micron đã bán hết, giá trung bình DRAM tăng hơn 110% so với cùng kỳ, biên lợi nhuận gộp đạt 74%. Samsung và SK Hynix cũng đều sản xuất và bán hết công suất.Trong bối cảnh này, vấn đề của Nvidia không phải khách hàng không muốn nhiều bộ nhớ hơn, mà là "tôi không thể lấy đủ chip LPDDR5X để lấp đầy các khe cắm".Việc giảm cấu hình SOCAMM mặc định cho mỗi khung máy thực chất là một biện pháp quản lý chuỗi cung ứng kỹ thuật: thay vì để thiếu bộ nhớ gây chậm trễ trong giao hàng toàn khung, tốt hơn là xuất xưởng với cấu hình thấp hơn để nhanh chóng đưa năng lực tính toán vào hoạt động.Đây không phải là tín hiệu nhu cầu co lại, ngược lại, là tín hiệu cầu vượt cung.Thứ ba, ít bộ nhớ hơn không đồng nghĩa với ít khung máy hơn.Thị trường đã làm một phép nhân đơn giản: giảm bộ nhớ mỗi khung máy một nửa → tổng nhu cầu giảm một nửa. Nhưng còn một biến số khác: số lượng xuất xưởng.Nếu mỗi khung SOCAMM giảm từ 55TB xuống còn 28TB, trong cùng điều kiện hạn chế cung LPDDR5X, Nvidia có thể lắp ráp nhiều khung hơn. Ban đầu, một lô bộ nhớ đủ cho 100 khung, nay đủ cho gần 200 khung.Tổng lượng tiêu thụ LPDDR5X không giảm, chỉ là phân bổ cho nhiều khung hơn. Đối với Nvidia, đây là cách thực dụng để đẩy nhanh việc đưa Rubin ra thị trường; còn đối với các nhà sản xuất bộ nhớ, tổng đơn hàng có thể không giảm.Hơn nữa, khả năng linh hoạt về nhu cầu bộ nhớ CPU rất lớn. Không phải tất cả các tác vụ đều cần 1.5TB LPDDR5X. Mặc dù huấn luyện mô hình lớn tiêu thụ nhiều bộ nhớ, nhưng phần lớn các tác vụ suy luận, đặc biệt là AI agentic và suy luận ngữ cảnh dài, có thể linh hoạt điều phối KV cache giữa HBM và LPDDR qua NVLink-C2C. Đối với nhiều khách hàng, 768GB bộ nhớ CPU đã đủ dùng.Vậy tại sao Micron vẫn giảm 10%?Bởi SemiAnalysis chỉ là cọng rơm cuối cùng làm đổ chiếc lạc đà.Cọng rơm đầu tiên là Broadcom. Trước giờ mở cửa phiên Mỹ ngày 4 tháng 6, Broadcom công bố báo cáo tài chính Quý 2. Số liệu không tệ: doanh thu 22.19 tỷ USD, tăng 48% so với cùng kỳ, EPS không GAAP 2.44 USD vượt dự kiến. Nhưng CEO Chen Fuyang không nâng dự báo doanh thu AI chip cả năm 1000 tỷ USD, thị trường cho rằng "chưa đủ". Cổ phiếu Broadcom giảm 15%, kéo theo toàn bộ ngành bán dẫn giảm theo.Trong ngày đó, Micron không có bất kỳ tin xấu nào từ phía công ty. Các phương tiện truyền thông như TipRanks, Motley Fool, 24/7 Wall St. đều rõ ràng chỉ ra rằng đây là một đợt giảm chung theo liên minh "bắt cóc bỏ đĩa". Micron, là trung tâm của chuỗi cung ứng bộ nhớ AI, có mối liên hệ chặt chẽ với tâm lý đầu tư AI, dự báo của Broadcom khiến thị trường đánh giá lại tốc độ tăng trưởng dự kiến của toàn chuỗi ngành chip AI.Báo cáo của SemiAnalysis lan truyền cùng ngày, tạo ra một câu chuyện hoàn hảo cho các nhà giao dịch đang tìm lý do bán ra: không chỉ tâm lý AI chung yếu đi, mà cả con số nhu cầu bộ nhớ cụ thể cũng đang co lại.Một cổ phiếu trị giá hàng nghìn tỷ USD, đã tăng 900% trong năm qua, mới hôm trước còn lập đỉnh lịch sử. Ở vị trí này, bất kỳ tiêu đề tiêu cực nào cũng là chất xúc tác chốt lời. Sự hoảng loạn không cần đúng, chỉ cần có lý do.Phân tích xu hướngBa nhận định.Thứ nhất, báo cáo của SemiAnalysis là chính xác, nhưng thị trường hiểu sai về nó. Cấu hình SOCAMM mặc định của Rubin NVL72 khả năng cao sẽ thấp hơn giá trị tối đa lý thuyết, do thực tế chuỗi cung ứng và độ linh hoạt của khách hàng quyết định. Nhưng "cấu hình mặc định giảm" và "nhu cầu bộ nhớ co lại" cách nhau một khoảng cách lớn, bởi có một kiến trúc module có thể nâng cấp, và ngành công nghiệp này đang vượt quá khả năng cung ứng.Thứ hai, rủi ro cốt lõi của Micron hiện tại không nằm ở SOCAMM, mà ở HBM4. SemiAnalysis đã báo cáo từ tháng 2 năm nay rằng, trong các đơn hàng HBM4 của nền tảng Rubin của Nvidia, phần của Micron là bằng 0, SK Hynix chiếm 70%, Samsung 30%. Dù Micron đã công bố sản xuất và giao hàng HBM4 từ tháng 3, thị phần dự kiến chỉ khoảng 18%. Ngược lại, vị thế của Micron trong lĩnh vực SOCAMM rất vững chắc: là nhà sản xuất đầu tiên ra mắt SOCAMM 256GB, là đối tác chính của Nvidia trong 5 năm qua. Việc giảm cấu hình SOCAMM thực tế ít ảnh hưởng hơn nhiều so với việc HBM4 bị cạnh tranh hoặc bị cạnh tranh.Thứ ba, đợt giảm giá này là do cổ phiếu trị giá hàng nghìn tỷ USD sau khi lập đỉnh lịch sử, bị chốt lời do hai yếu tố riêng biệt thúc đẩy. Broadcom tạo ra cú sốc tâm lý, SemiAnalysis cung cấp câu chuyện để biện minh. Cộng hưởng hai yếu tố này khiến một cổ phiếu tăng gấp 9 lần trong 12 tháng vừa qua, điều chỉnh giảm 10%. Từ góc độ giao dịch, đây không gọi là "hoảng loạn", mà là "bình thường".Dylan Patel đã đúng khi nói trong tweet của mình: hầu hết những người chia sẻ lại báo cáo của ông, thực ra đã bỏ qua phần quan trọng nhất trong đó.Điều nguy hiểm nhất trong đầu tư bán dẫn không phải là nhìn sai hướng, mà là nhìn đúng tiêu đề nhưng tính sai công thức.

55TB biến thành 28TB? Tin đồn và hoảng loạn đằng sau việc giảm một nửa bộ nhớ Rubin

Chủ đề thịnh hành

ShareYourUSStocksWinNvidia

PredictNBAChampionWin20000U

IsraelStrikesIranBTCPlunges

BitcoinETFSees7272BTCOutflow

SpaceXRoadshowHighlightsAsteroidMining

Đã ghim