Jensen Huang tung ra nền tảng Vera Rubin nặng 2,5 tấn tại CES 2026, quyết tâm chinh phục AI vật lý

2026-03-05 22:12:18

CES 2026 vừa rồi đã chứng kiến một bước ngoặt lịch sử trong ngành AI khi Jensen Huang, CEO NVIDIA, mang đến sân khấu một “máy móc thần kỳ” nặng 2,5 tấn. Khác với các năm trước tập trung vào card đồ họa tiêu dùng, lần này jensen huang đã chuyển hướng hoàn toàn sang hệ thống tính toán cho doanh nghiệp, công bố nền tảng Vera Rubin – một bước nhảy vọt trong lịch sử phát triển GPU của NVIDIA.

Trong vòng 48 giờ, jensen huang xuất hiện tại ba sự kiện lớn: NVIDIA Live, hội thảo công nghệ AI với Siemens, và TechWorld của Lenovo. Sự xuất hiện liên tục này không phải ngẫu nhiên – nó phản ánh chiến lược tổng thể của NVIDIA trong việc xây dựng hệ sinh thái AI cho các ứng dụng thực tế.

Vera Rubin: Bước nhảy vọt trong kiến trúc chip NVIDIA

Nền tảng Vera Rubin, được đặt tên theo nhà thiên văn học nổi tiếng, đại diện cho sự đổi mới căn bản. Lần đầu tiên trong lịch sử NVIDIA, một thế hệ sản phẩm không chỉ tìm cách cải tiến mà còn thiết kế lại toàn bộ 6 loại chip khác nhau cùng lúc, hiện đã bước vào giai đoạn sản xuất hàng loạt.

Nguyên nhân của sự thay đổi này rất rõ ràng: Định luật Moore đã chậm lại. Cách tiếp cận truyền thống không còn theo kịp tốc độ tăng gấp 10 lần mỗi năm của các mô hình AI. Jensen Huang và NVIDIA đã chọn con đường “thiết kế phối hợp cực hạn” – đổi mới đồng thời ở tất cả các cấp độ.

Bộ sáu chip bao gồm:

Vera CPU: 88 nhân Olympus tùy chỉnh, bộ nhớ hệ thống 1,5 TB (gấp 3 lần thế hệ Grace), hỗ trợ 176 luồng xử lý với băng thông NVLink C2C 1,8 TB/s
Rubin GPU: Sức mạnh suy luận NVFP4 đạt 50 PFLOPS (gấp 5 lần Blackwell), tích hợp engine Transformer thế hệ 3
ConnectX-9: Mạng Ethernet 800 Gb/s với RDMA có thể lập trình
BlueField-4 DPU: Bộ xử lý chuyên dụng với 64 nhân Grace CPU, gắn kèm 150TB bộ nhớ ngữ cảnh
NVLink-6 Switch: Kết nối 72 GPU chạy như một khối thống nhất
Spectrum-6: Công nghệ quang học với 512 kênh, mỗi kênh 200Gbps

Hiệu năng vượt xa mong đợi

Hệ thống Vera Rubin NVL72 mang lại những con số gây choáng ngợp. Trong tác vụ suy luận, sức mạnh tính toán đạt 3,6 EFLOPS, cao gấp 5 lần Blackwell. Về huấn luyện, hiệu năng đạt 2,5 EFLOPS, tăng 3,5 lần.

Dung lượng bộ nhớ LPDDR5X lên tới 54TB (gấp 3 lần thế hệ trước), trong khi bộ nhớ HBM4 đạt 1,6 PB/s, tăng 2,8 lần. Điều ấn tượng nhất là, mặc dù hiệu năng tăng lên gấp bội, số lượng transistor chỉ tăng 1,7 lần lên 220 nghìn tỷ.

Ngay cả từ góc độ chi phí, Vera Rubin cũng thể hiện sức mạnh. Để huấn luyện mô hình 100 nghìn tỷ tham số, nó chỉ cần 1/4 số lượng hệ thống Blackwell, chi phí tạo một Token chỉ bằng 1/10. Về hiệu suất năng lượng, throughput (số AI Token hoàn thành mỗi watt-mỗi đô la) tăng lên 10 lần – đối với trung tâm dữ liệu gigawatt trị giá 50 tỷ USD, điều này có nghĩa là doanh thu tăng gấp đôi.

Công nghệ kết nối mạng Spectrum-X: “Miễn phí” 5 tỷ USD

Jensen Huang đã tính toán chính xác: Spectrum-X, nền tảng mạng Ethernet đầu-cuối dành riêng cho AI sinh tạo, có thể tăng throughput lên 25%, tương đương tiết kiệm 5 tỷ USD cho trung tâm dữ liệu gigawatt. Ông nói một cách tự tin: “Hệ thống mạng này gần như là miễn phí.”

Công nghệ này sử dụng quy trình COOP của TSMC, tích hợp silicon photon, cho phép các GPU và BlueField-4 trải dài hàng vạn thiết bị vẫn hoạt động như một bộ nhớ duy nhất.

Giải quyết “vấn đề đuôi dài” của bộ nhớ ngữ cảnh

Một thách thức lớn mà ngành AI từng gặp là KV Cache (bộ nhớ đệm key-value), tức “trí nhớ tác vụ” của AI. Khi hội thoại dài và mô hình lớn, bộ nhớ HBM trở nên quá tải.

Vera Rubin giải quyết vấn đề này bằng cách triển khai BlueField-4 trong mỗi giá server. Mỗi node có 4 BlueField-4, mỗi cái gắn 150TB bộ nhớ ngữ cảnh, cung cấp 16TB cho mỗi GPU mà không giảm tốc độ truyền dữ liệu (vẫn giữ 200Gbps).

Bảo mật được tăng cường

Vera Rubin hỗ trợ Confidential Computing – mọi dữ liệu đều được mã hóa suốt quá trình truyền, lưu trữ, và tính toán, bao gồm PCIe, NVLink, và giao tiếp CPU-GPU. Doanh nghiệp có thể yên tâm triển khai mô hình mà không lo rò rỉ dữ liệu.

Mã nguồn mở và agent: Xu hướng chính

Jensen Huang đã nhắc nhở cộng đồng về vai trò quan trọng của phần mềm mã nguồn mở. Ông đặc biệt ca ngợi DeepSeek V1 – hệ thống suy luận mã nguồn mở đầu tiên, đã khiến cả thế giới bất ngờ. Trên slide của ông, các mô hình như Kimi k2 và DeepSeek V3.2 được liệt kê là số 1 và số 2 trong lĩnh vực.

Mặc dù các mô hình mã nguồn mở hiện tại có thể kém 6 tháng so với các mô hình hàng đầu, nhưng cứ mỗi 6 tháng lại có mô hình mới xuất hiện. Tốc độ lặp lại này chính là lý do tại sao startup, ông lớn, và nhà nghiên cứu đều không muốn bỏ lỡ – kể cả NVIDIA.

NVIDIA xây dựng hệ sinh thái mã nguồn mở bao gồm y sinh, AI vật lý, mô hình agent, robot và tự lái. Họ cũng phát triển các mô hình tiên tiến như La Proteina (tổng hợp protein) và OpenFold 3, cùng siêu máy tính DGX Cloud trị giá nhiều tỷ USD.

AI vật lý: Chinh phục thế giới thực

Nếu mô hình ngôn ngữ lớn giải quyết vấn đề “thế giới số”, thì tham vọng tiếp theo của jensen huang rõ ràng là chinh phục “thế giới vật lý”.

Jensen Huang đề xuất kiến trúc “ba máy tính lõi” cho Physical AI: máy tính huấn luyện (xây dựng từ GPU), máy tính suy luận (tiểu não đặt ở biên robot hoặc ô tô), và máy tính mô phỏng (Omniverse và Cosmos).

Alpamayo: Hệ thống tự lái có khả năng suy luận

Dựa trên kiến trúc này, Jensen Huang chính thức công bố Alpamayo – mô hình lái xe tự động đầu tiên trên thế giới có khả năng suy nghĩ và suy luận thực sự.

Khác với tự lái truyền thống, Alpamayo không chỉ thực thi theo mã lệnh cứng nhắc. Khi gặp những tình huống giao thông phức tạp chưa từng gặp, nó có thể suy luận như tài xế con người: “Nó sẽ nói cho bạn biết sắp làm gì, và tại sao lại quyết định như vậy.”

Mercedes CLA trang bị công nghệ Alpamayo sẽ chính thức ra mắt tại Mỹ trong quý I 2026, sau đó tiếp tục đến các thị trường châu Âu và châu Á. Chiếc xe này được NCAP đánh giá là ô tô an toàn nhất thế giới nhờ thiết kế “ngăn xếp an toàn kép” độc đáo của NVIDIA – khi mô hình AI không đủ tự tin, hệ thống sẽ chuyển sang chế độ an toàn truyền thống.

Chiến lược robot: Từ Boston Dynamics đến nhà máy

Tất cả robot sẽ trang bị máy tính mini Jetson, được huấn luyện trong Isaac Simulator trên nền tảng Omniverse. NVIDIA đang tích hợp công nghệ này vào hệ sinh thái công nghiệp như Synopsys, Cadence, Siemens.

Jensen Huang mời lên sân khấu các robot hình người, robot bốn chân từ Boston Dynamics và Agility, cùng các robot Disney dễ thương. Nhưng ông nhấn mạnh điểm quan trọng nhất: “Robot lớn nhất thực ra chính là nhà máy.”

Trong tương lai, thiết kế chip, thiết kế hệ thống, mô phỏng nhà máy – tất cả đều sẽ được AI vật lý tăng tốc. Jensen Huang thậm chí nói với cơ biên đội robot: “Các bạn sẽ được thiết kế trong máy tính, sản xuất trong máy tính, thậm chí được kiểm tra và xác nhận trong máy tính trước khi thực sự đối mặt với trọng lực.”

Chiến lược toàn diện của jensen huang

Trong bối cảnh tranh cãi về bong bóng AI, jensen huang dường như cần chứng minh AI thực sự làm được gì. Ngoài công bố sức mạnh nền tảng Vera Rubin, ông còn đầu tư nhiều vào ứng dụng và phần mềm.

Từ việc trước đây làm chip cho thế giới ảo, bây giờ NVIDIA trực tiếp trình diễn và tập trung vào Physical AI – tự lái, robot hình người – để bước vào thế giới vật lý thực tế. Như jensen huang nói: “Chỉ khi trận chiến diễn ra, vũ khí mới có thể tiếp tục bán được.”

CES 2026 đã chứng minh rằng, với jensen huang ở nhân, NVIDIA không chỉ bán chip – họ xây dựng tương lai cho AI vật lý.

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.