Huang Renxun GTC 2026 định nghĩa lại PC: Vera Rubin trở thành CPU Agentic đầu tiên, Nvidia hợp tác với MediaTek ra mắt cuộc cách mạng laptop RTX SPARK

Huang Renxun đã công bố hai tin tức quan trọng tại bài phát biểu chủ đề GTC Taipei 2026: ra mắt chính thức CPU Vera Rubin dành cho kỷ nguyên AI Agentic, và nền tảng máy tính cá nhân RTX SPARK hợp tác thiết kế đầu tiên kết hợp CPU, GPU và NVLink trên một wafer duy nhất, tượng trưng cho việc kiến trúc PC chính thức bước vào kỷ nguyên tính toán AI cấp máy chủ.
(Tiền đề: Huang Renxun tiết lộ "Kinh tế Token" tại GTC 2026: tính toán là doanh thu, Nvidia bắt đầu sản xuất hàng loạt Vera Rubin, nhu cầu AI tại Đài Loan tăng vọt)
(Bổ sung nền tảng: Huang Renxun nói về "Hardness" tại GTC 2026? Tại sao LLM Agent cần cứng hóa, một câu nói đã tiết lộ chìa khóa để AI代理 triển khai)

Mục lục bài viết

Chuyển đổi

  • Vera Rubin: CPU đầu tiên trong lịch sử thiết kế dành riêng cho AI Agentic
  • RTX SPARK: Hợp tác với MediaTek, cuộc cách mạng lớn nhất trong kiến trúc PC suốt 50 năm
  • Hệ sinh thái phần mềm Adobe toàn diện đón nhận, máy chủ MCP mở khóa quy trình làm việc Agentic
  • Thời điểm định nghĩa lại máy tính cá nhân

Trong bài phát biểu tại GTC 2026 ở Đài Bắc, Huang Renxun đã vẽ ra một lộ trình rõ ràng cho tương lai của máy tính cá nhân. Từ Vera Rubin tại trung tâm dữ liệu đến RTX SPARK trên bàn làm việc, NVIDIA đang mang kiến trúc cấp máy chủ cho AI vào lĩnh vực tính toán cá nhân, và tất cả bắt đầu từ một CPU được thiết kế đặc biệt cho AI Agent (AI đại lý).

Vera Rubin: CPU đầu tiên trong lịch sử dành riêng cho AI Agentic

Vera là CPU đầu tiên của NVIDIA được thiết kế từ đầu để phục vụ thời đại AI đại lý. So với các bộ xử lý máy chủ x86 truyền thống, điểm khác biệt lớn nhất của Vera nằm ở việc tối ưu hóa cực đoan về "băng thông" và "độ trễ", hai trở ngại lớn nhất trong quy trình làm việc của AI Agent.

Về phần cấu hình phần cứng, CPU Vera hỗ trợ giao diện PCIe Gen 6, cung cấp băng thông dữ liệu lên tới 1.4 TB/s; về bộ nhớ, sử dụng LPDDR5X ECC với băng thông khoảng 1.2 TB/s, đảm bảo AI Agent khi xử lý các nhiệm vụ suy luận quy mô lớn thời gian thực không bị chậm do trì hoãn chuyển dữ liệu. Huang Renxun nhấn mạnh trong bài phát biểu rằng, Vera vượt trội hơn các máy chủ x86 cùng cấp về hiệu suất độ trễ đầu cuối trong các tải trọng AI.

Nền tảng AI Vera Rubin không chỉ là một sản phẩm đơn lẻ, mà là một hệ thống gồm 7 chip và 5 loại cấu hình tủ rack khác nhau. Trong đó, nổi bật nhất là tủ NVL72, tích hợp 72 GPU Rubin và 36 CPU Vera, dành riêng cho suy luận AI Agentic quy mô cực lớn. Ngoài ra, NVIDIA còn tích hợp LPU (đơn vị xử lý ngôn ngữ) của Groq, mua lại với giá 2 tỷ USD vào năm ngoái, để tạo ra phần cứng chuyên dụng xử lý đầu ra có cấu trúc của AI Agent, giúp "suy nghĩ" và "hành động" của agent có phần cứng tăng tốc riêng biệt.

RTX SPARK: Hợp tác với MediaTek, cuộc cách mạng lớn nhất trong kiến trúc PC suốt 50 năm

Nếu Vera Rubin định nghĩa tương lai Agentic của trung tâm dữ liệu, thì RTX SPARK chính là chìa khóa mang tương lai đó trực tiếp lên bàn làm việc của bạn. Đây là hệ thống SoC (hệ thống trên chip) đầu tiên của NVIDIA dành cho laptop, sử dụng quy trình 3nm của TSMC, với số lượng transistor lên tới 70 tỷ.

Kiến trúc cốt lõi của RTX SPARK tích hợp ba thành phần chính: CPU Grace 20 nhân do MediaTek thiết kế chung, GPU Blackwell thế hệ với 6,144 nhân CUDA, và bộ nhớ thống nhất 128GB. Thiết kế đột phá nhất là công nghệ kết nối NVLink C2C, một kênh kết nối nội chip tốc độ lên tới 600 GB/s, gấp năm lần PCIe Gen 5, giúp truyền dữ liệu giữa CPU và GPU gần như không độ trễ.

"Hãy tưởng tượng, lần đầu tiên trong lịch sử máy tính cá nhân, CPU, GPU và kết nối tốc độ cao đều được đóng gói trên cùng một wafer." Huang Renxun nói trong bài phát biểu. Trước đây, chỉ các phòng thí nghiệm AI hàng đầu như OpenAI mới có kiến trúc này trong trung tâm dữ liệu, nay đã thu nhỏ thành một thiết bị kích thước laptop. Hiệu năng AI FP4 của RTX SPARK đạt tới 1 petaflop, mức hiệu năng mà trước đây chỉ có thể đạt được trong một tủ GPU máy chủ.

Hệ sinh thái phần mềm Adobe toàn diện đón nhận, máy chủ MCP mở khóa quy trình làm việc Agentic

RTX SPARK không chỉ là sự kết hợp của phần cứng, mà còn là sự phối hợp của hệ sinh thái phần mềm. Huang Renxun công bố rằng Adobe đã viết lại các engine render cốt lõi của Photoshop và Premiere Pro cho nền tảng RTX SPARK, giúp tăng hiệu năng tối đa gấp đôi.

Đặc biệt, Adobe cũng ra mắt MCP (Model Context Protocol) server, cho phép AI Agent trực tiếp điều khiển các chức năng bên trong của Photoshop và Premiere, từ tự động chỉnh sửa ảnh, chỉnh màu hàng loạt đến tự động hóa quy trình chỉnh sửa video, tất cả đều có thể thực hiện qua lệnh bằng ngôn ngữ tự nhiên. Đây chính là hiện thực hóa tầm nhìn "AI Agentic" mà Huang Renxun liên tục nhấn mạnh tại GTC 2026: phần cứng (RTX SPARK) cung cấp sức mạnh AI nội tại, phần mềm (Adobe MCP) giúp AI Agent thực sự "điều khiển".

Thời điểm định nghĩa lại máy tính cá nhân

Kể từ năm 1981, khi IBM PC xác lập tiêu chuẩn kiến trúc x86, logic thiết kế cốt lõi của máy tính cá nhân gần như không có sự thay đổi căn bản nào, CPU đảm nhiệm tính toán chung, GPU đảm nhiệm xử lý đồ họa, hai thành phần giao tiếp qua bus chậm. Hai phát kiến quan trọng tại GTC 2026 đang thay đổi công thức đã tồn tại gần nửa thế kỷ này.

Vera Rubin chứng minh giá trị của việc thiết kế lại kiến trúc CPU dành riêng cho các tải trọng AI: không phải là x86 nhanh hơn chút nào, mà là một dạng tính toán hoàn toàn khác. RTX SPARK mang kiến trúc bộ nhớ thống nhất cấp máy chủ vào thị trường tiêu dùng, biến máy tính cá nhân từ "công cụ sản xuất" thành "máy chủ AI Agent".

Đằng sau cuộc cách mạng này là mạng lưới chuỗi cung ứng khổng lồ của NVIDIA tại Đài Loan, gồm hơn 150 nhà cung cấp hợp tác, từ đóng gói tiên tiến CoWoS-R/L của TSMC 3nm, đến sản xuất hệ thống của Foxconn, Quanta, đưa Đài Loan trở lại vị trí trung tâm của một bước chuyển đổi quan trọng nhất trong lịch sử máy tính cá nhân.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim