AI PC đã đến, cứng đầu với mô hình lớn 120B tại chỗ! Nvidia dùng RTX Spark định nghĩa lại “máy tính AI cá nhân” nền tảng

Trong hai năm qua, các nhà sản xuất PC liên tục đề cập đến một tham số khi quảng bá “PC AI”: khả năng tính toán NPU. Nhưng dù là 45 TOPS của Lunar Lake của Intel hay 50 TOPS của Strix Point của AMD, những con số này vẫn chỉ dừng lại ở mức độ khá nhẹ nhàng. Có thể làm mờ nền, có thể giảm tiếng ồn của âm thanh, có thể chạy một số mô hình nhỏ gọn ở phía cuối thiết bị, nhưng chỉ đến đó.

Ngày 31 tháng 5, Nvidia tại hội nghị GTC 2026 đã trình làng chip siêu RTX Spark, đưa con số này lên tới 1 petaflop, tức là 1000 TOPS. Không phải tăng 30% hay 50%, mà là vượt qua một cấp số nhân.

Cùng ngày còn có các thông báo khác: Microsoft phối hợp với RTX Spark nâng cấp cơ chế bảo mật gốc của Windows, và đưa sandbox mã nguồn mở OpenShell của Nvidia vào nền tảng Windows; Adobe tuyên bố tái cấu trúc Photoshop và Premiere từ nền tảng, đặc biệt để phù hợp với kiến trúc bộ nhớ thống nhất của RTX Spark; sáu nhà OEM đầu tiên xác nhận sẽ ra mắt các mẫu laptop mỏng nhẹ và máy tính để bàn nhỏ gọn trang bị chip này vào mùa thu năm nay.

Những gì Nvidia làm tại GTC lần này không chỉ là ra mắt một chip mới. Họ đang cố gắng đặt ra một tiêu chuẩn phần cứng mới cho dòng “máy tính cá nhân AI”.

image

Khi GPU trở thành trung tâm của PC

Trước tiên, hãy xem xét chính chip này. Theo dữ liệu công bố tại GTC của Nvidia, RTX Spark tích hợp một GPU dựa trên kiến trúc Blackwell, 6144 lõi CUDA, kết hợp với CPU Arm 20 nhân Grace do MediaTek hợp tác thiết kế, sử dụng quy trình TSMC 3nm. Thay đổi then chốt nằm ở kiến trúc bộ nhớ: bộ nhớ thống nhất tối đa 128GB, CPU và GPU chia sẻ cùng một pool bộ nhớ, dữ liệu không cần phải di chuyển qua lại giữa hai phần.

Điều này hoàn toàn trái ngược với kiến trúc PC truyền thống.

Cấu trúc cơ bản của PC cũ là “CPU x86 làm trung tâm xử lý chính, GPU riêng biệt là phụ kiện tùy chọn”. Ngay cả khái niệm AI PC mới nổi gần đây, cách làm của Intel và AMD cũng là tích hợp một NPU trong CPU, như một mô-đun tăng tốc AI phụ trợ, với khả năng tính toán thường khoảng 40-50 TOPS. GPU vẫn là “phụ kiện gắn ngoài”.

RTX Spark đã phân chia lại quyền lực này. SoC này biến GPU thành trung tâm, CPU lui về vai trò phụ. Nvidia cung cấp khả năng tính toán AI là 1 petaflop FP4, tương đương 1000 TOPS, gấp hơn 20 lần khả năng của NPU tích hợp trong các thế hệ AI PC trước. Đây không chỉ là tăng tốc trên cùng một đường đua, mà là bắt đầu một đường đua mới.

Tốc độ theo dõi của các nhà OEM xác nhận cho thấy nhận định này đúng. Theo thông báo chính thức của Nvidia và các báo cáo sau đó của DIGITIMES, Asus, Dell, HP, Lenovo, Surface của Microsoft và MSI sẽ ra mắt các mẫu laptop mỏng nhẹ và máy tính để bàn nhỏ gọn trang bị RTX Spark trong mùa thu này, các mẫu của Acer và Gigabyte sẽ theo sau. Hầu hết các thương hiệu PC Windows chính thống đều đã tham gia.

image

RTX Spark không phải là sản phẩm ra đời từ con số không. Đầu năm 2025, cùng với lõi Blackwell và Grace, chip này đã từng xuất hiện dưới dạng Project DIGITS và DGX Spark, nhưng lúc đó hướng tới các siêu máy tính Linux dành cho nhà phát triển, kích thước gần như một chiếc máy tính để bàn nhỏ. Một năm sau, kiến trúc này đã được thu gọn vào không gian tản nhiệt của các laptop mỏng nhẹ, hệ điều hành chuyển từ Linux sang Windows, và đối tượng người dùng mở rộng từ các nhà phát triển AI sang người tiêu dùng phổ thông và doanh nghiệp. Đây chính là điểm đáng chú ý nhất trong các sản phẩm tiêu dùng GTC 2026: Nvidia không chỉ ra mắt một món đồ chơi dành cho nhà phát triển, mà đang mở cánh cửa thị trường tiêu dùng.

Mô hình 120B chạy tại chỗ, có đủ dùng không?

Khả năng tính toán và bộ nhớ cuối cùng đều phải trả lời một câu hỏi: chúng ta có thể làm gì?

Trong buổi giới thiệu, Nvidia đưa ra câu trả lời là RTX Spark hỗ trợ chạy tại chỗ các mô hình lớn 120B tham số, với cửa sổ ngữ cảnh có thể lên tới hàng triệu token. 120B là gì? Để tham chiếu, hiện tại, cách phổ biến để chạy mô hình lớn tại chỗ trên phần cứng tiêu dùng là RTX 4090 24GB, qua nén lượng tử, có thể chạy các mô hình 30B đến 40B tham số. Một số mô hình nhỏ hơn, chạy trên card đồ họa tiêu dùng, có thể đạt 9B. Từ 9B đến 120B, mức nhảy vọt này đã định nghĩa lại tiêu chuẩn “đủ dùng” của AI phía cuối thiết bị.

128GB bộ nhớ thống nhất là điều kiện tiên quyết cho tất cả những điều này. Trong kiến trúc PC truyền thống, CPU có bộ nhớ hệ thống riêng, GPU có bộ nhớ riêng, hai phần này có giới hạn vật lý rõ ràng. Một mô hình lớn vượt quá dung lượng bộ nhớ của GPU sẽ không thể chạy hoặc phải chia nhỏ mô hình, trao đổi bộ nhớ phức tạp, tốc độ giảm mạnh. Kiến trúc bộ nhớ thống nhất loại bỏ giới hạn này, dữ liệu mô hình được đưa thẳng vào pool chia sẻ 128GB, CPU và GPU đều có thể truy cập. Apple đã chứng minh khả năng này trên Apple Silicon, và giờ Nvidia mang nó sang nền tảng Windows.

Ngoài khả năng suy luận mô hình lớn, các trường hợp sử dụng Nvidia liệt kê còn gồm chỉnh sửa video 12K, dựng cảnh 3D trên 90GB, chơi game ray tracing với hơn 100 fps ở độ phân giải 1440p. Những cảnh này đều có đặc điểm chung là lượng dữ liệu xử lý mỗi lần cực lớn, PC truyền thống hoặc là phải chờ đợi gấp nhiều lần thời gian xử lý, hoặc là không thể chạy nổi.

“Hỗ trợ chạy” và “mượt mà sử dụng” còn cách nhau một đoạn. Nvidia chưa công bố tốc độ suy luận thực tế của mô hình 120B trên RTX Spark, cũng chưa đưa ra độ trễ token đầu tiên trong các kịch bản ngữ cảnh hàng triệu token. Chỉ số quyết định tốc độ suy luận ngữ cảnh dài là băng thông bộ nhớ. Tham khảo, DGX Spark dùng cùng lõi GB10, đo thực tế băng thông bộ nhớ khoảng 301GB/s. Với băng thông này, chạy mô hình 120B là khả thi, nhưng khi xử lý ngữ cảnh hàng triệu token, người dùng có thể phải chờ vài giây để thấy token đầu ra đầu tiên. Phiên bản laptop của RTX Spark có thể bị giới hạn bởi tiêu thụ năng lượng, dẫn đến băng thông thực tế còn thấp hơn.

Thêm một lớp an toàn cho AI

Ngoài khả năng tính toán, một điểm quan trọng khác của công bố là hợp tác giữa Nvidia và Microsoft về hệ thống. Đây có thể là nội dung dễ bị bỏ qua nhất trong GTC 2026, nhưng ảnh hưởng sâu rộng nhất đến ngành.

Một chiếc máy tính có thể chạy mô hình 120B, nếu giao cho một AI đại lý có thể tự thao tác trên desktop, nhấn nút, đọc ghi file, thì rủi ro an toàn không còn chỉ là “dữ liệu có bị mất hay không”, mà là “đại lý có làm những việc bạn không mong muốn hay không”. Nếu không giải quyết được vấn đề này, doanh nghiệp không thể triển khai thiết bị như vậy cho nhân viên.

Giải pháp của Microsoft và Nvidia là hai lớp phòng thủ. Lớp thứ nhất, Microsoft nâng cấp cơ chế bảo mật gốc của Windows, cung cấp khả năng giám sát và hạn chế hành vi của AI đại lý từ cấp hệ điều hành. Lớp thứ hai, Nvidia chính thức đưa OpenShell runtime mã nguồn mở vào Windows. Theo tài liệu chính thức của Nvidia, OpenShell là một sandbox runtime mã nguồn mở, cung cấp cách ly ở cấp kernel. Nó giới hạn phạm vi hoạt động của AI đại lý trong phạm vi kiểm soát, nhưng quyền hạn bị giới hạn nghiêm ngặt, không thể truy cập vượt ra ngoài các tệp hệ thống, kết nối mạng hoặc dữ liệu nhạy cảm của người dùng.

Tổ hợp này có ý nghĩa rõ ràng đối với các doanh nghiệp khi mua sắm. Trước đây, khái niệm “AI đại lý tại chỗ” chỉ dừng lại ở trình diễn công nghệ. Phần cứng chạy được, nhưng khung bảo mật còn trống rỗng. Không doanh nghiệp IT nào dám đưa thiết bị trong trạng thái này vào danh sách mua sắm. Nvidia và Microsoft đã chèn một lớp cách ly tiêu chuẩn giữa phần cứng và ứng dụng, biến “có thể dùng” thành “quản lý được”.

Hiệu suất của OpenShell là một biến số cần theo dõi. Thường sandbox sẽ gây ra một số tổn thất về hiệu năng, ảnh hưởng thế nào đến tốc độ suy luận hoặc phản hồi hệ thống, Nvidia chưa công bố dữ liệu chính thức. Các vấn đề thực tế như độ phức tạp trong triển khai của bộ phận IT doanh nghiệp, khả năng tương thích với các chính sách bảo mật hiện có, sẽ cần thời gian để xác minh sau khi các thiết bị OEM ra mắt.

Tại sao Adobe sẵn lòng “từ dưới lên xây dựng lại”

Mức độ phối hợp của các nhà phần mềm thường là chỉ số dự báo khả năng tồn tại của một nền tảng phần cứng mới.

Trong GTC, Adobe là đơn vị công bố phần lớn các hoạt động phần mềm trong đợt này. Theo blog chính thức của Nvidia và xác nhận của các lãnh đạo Adobe, Adobe bắt đầu tái cấu trúc toàn bộ Photoshop và Premiere, đặc biệt để phù hợp với kiến trúc bộ nhớ thống nhất của RTX Spark, tuyên bố khả năng tăng tốc AI và đồ họa lên gấp 2 lần.

“Tái cấu trúc từ dưới lên” không chỉ là cài plugin hay làm lớp phù hợp. Trên PC truyền thống, CPU và GPU có bộ nhớ riêng, khi xử lý các tệp PSD lớn hoặc video 8K, dữ liệu phải liên tục di chuyển qua lại giữa hai bộ nhớ này, gây lãng phí hiệu năng. Kiến trúc bộ nhớ thống nhất của RTX Spark cho phép CPU và GPU chia sẻ trực tiếp cùng một không gian 128GB, thay đổi này có giá trị thực tế đối với quy trình làm việc của các nhà sáng tạo chuyên nghiệp. Adobe đã phải chỉnh sửa mã nguồn, chứng tỏ họ công nhận hướng kiến trúc này không chỉ là một chiến dịch marketing nhất thời.

Tuy nhiên, tiêu chuẩn “tăng tốc gấp 2 lần” dựa trên nền tảng nào, Nvidia và Adobe chưa công bố. Là so sánh với bộ xử lý x86 cùng card đồ họa riêng, hay với giải pháp NPU của thế hệ trước? Trước khi có kết quả benchmark rõ ràng, con số này chỉ có thể đặt dấu hỏi.

Cũng đồng thời, các đối tác hỗ trợ gồm Blackmagic Design, ComfyUI, llama.cpp, OTOY và nhiều nhà phát triển game. Đặc biệt, sự hỗ trợ của cộng đồng phát triển mở như ComfyUI và llama.cpp cho thấy tiềm năng hệ sinh thái của nền tảng này còn rất lớn, vượt xa các cam kết của các hãng lớn.

Nvidia đang dùng hệ sinh thái CUDA và kiến trúc bộ nhớ thống nhất để xây dựng trải nghiệm giống như Apple tích hợp phần mềm và phần cứng trên Windows. Khác biệt là, Apple tự xây dựng tường thành, Nvidia cần thuyết phục Microsoft và các nhà phát triển phần mềm độc lập cùng xây dựng. Adobe sẵn lòng bắt đầu từ dưới lên, ít nhất là đã đặt viên gạch đầu tiên cho bức tường này.

Ngoài tham số trên giấy tờ

Quay lại câu hỏi thực tế nhất: những thiết bị này có thể mua được không, mua về rồi dùng ra sao?

Theo Nvidia, các thiết bị RTX Spark đầu tiên sẽ ra mắt vào mùa thu năm nay, gồm các mẫu laptop mỏng nhẹ của Asus, Dell, HP, Lenovo, Surface của Microsoft và MSI, các mẫu của Acer và Gigabyte sẽ theo sau. Các nhà OEM chưa công bố giá chính thức hay ngày ra mắt cụ thể.

Quan trọng hơn là các câu hỏi về mặt vật lý: làm thế nào để cân bằng giữa tiêu thụ năng lượng và tản nhiệt khi tích hợp chip có khả năng 1 petaflop vào một chiếc laptop mỏng nhẹ? Hiệu năng và thời lượng pin trong các tác vụ văn phòng hàng ngày của RTX Spark ra sao? Bộ nhớ thống nhất 128GB trong dạng laptop có thể bị giới hạn băng thông do tiêu thụ năng lượng, dẫn đến giảm hiệu năng thực tế?

Những câu hỏi này mới là thử thách thực sự của quá trình thương mại hóa. Một con chip đạt đỉnh cao về mặt kỹ thuật trong mẫu thử nghiệm, nhưng lại không phản ánh được hiệu năng thực tế trong tay người dùng trung bình 8 tiếng mỗi ngày. Nvidia đã nhấn mạnh về hiệu suất năng lượng của RTX Spark, nhưng chưa công bố TDP hay dữ liệu về thời lượng pin.

Từ góc độ chiến lược ngành PC, sự xuất hiện của RTX Spark đánh dấu một mô hình phân chia mới đang hình thành. Trong ba mươi năm qua, quyền lực về chip trung tâm của PC chủ yếu nằm trong tay các nhà sản xuất x86, còn GPU dù ngày càng quan trọng nhưng vẫn chỉ là “phụ kiện gắn ngoài”. Lần này, Nvidia mang ra một SoC hoàn chỉnh, từ CPU đến GPU đến bộ điều khiển bộ nhớ, kiến trúc Arm do MediaTek thiết kế. Cơ cấu quyền lực của ngành PC đang chuyển từ “x86 CPU cộng thêm GPU tùy chọn” sang “nền tảng SoC dựa trên GPU”.

Chuyển đổi này sẽ không xảy ra trong một ngày. Chiến lược định giá của các OEM, hiệu năng thực tế của sản phẩm, tiến trình thích ứng phần mềm của các nhà phát triển phần mềm độc lập, vòng đời xác nhận mua hàng của khách hàng doanh nghiệp — từng bước một, đều quyết định RTX Spark có thể trở thành trục mới của ngành PC hay chỉ là một minh chứng công nghệ cao cấp, rồi sẽ lặng lẽ rút lui. Phải chờ đến mùa thu năm nay mới có câu trả lời chính xác.

NVDAX-0,59%
AAPLX3,09%
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim