AI PC來了,本地硬剛120B大模型!英偉達用RTX Spark重新定義“個人AI電腦”底座

過去兩年,PC廠商在宣傳“AI PC”時反覆提及一個參數:NPU算力。但不管是英特爾Lunar Lake的45 TOPS,還是AMD Strix Point的50 TOPS,這些數字始終停留在一個相對溫和的量級上。能做背景虛化、能做語音降噪、能跑一些小規模的端側模型,但也僅此而已。

5月31日,英偉達在GTC 2026大會上拿出的RTX Spark超芯片,把這個數字拉到了1 petaflop,也就是1000 TOPS。不是提升30%或50%,是直接跨過一個數量級。

同場發布的還有另外幾條消息:微軟配合RTX Spark升級了Windows原生安全機制,並把英偉達的開源沙盒運行時OpenShell引入Windows平台;Adobe宣布從底層重構Photoshop和Premiere,專門適配RTX Spark的統一內存架構;首批六家OEM廠商確認今年秋季推出搭載這顆芯片的輕薄筆記本和緊湊型台式機。

英偉達在這屆GTC上做的事情,不是發布一塊新芯片。它在試圖給“個人AI電腦”這個品類定下一個新的硬體標準。

image

當GPU成為PC的主角

先看這顆芯片本身。根據英偉達在GTC上公布的數據,RTX Spark集成了一顆Blackwell架構的GPU,6144個CUDA核心,搭配聯發科聯合設計的20核Arm架構Grace CPU,採用台積電3nm工藝。關鍵的變化在於內存架構:最高128GB的統一內存,CPU和GPU共享同一個內存池,數據不需要在兩者之間來回搬運。

這和過去PC的架構邏輯相反。

傳統PC的基本結構是“x86 CPU作為主處理器,獨立GPU作為可選配件”。即便是近年興起的AI PC概念,英特爾和AMD的做法也是在CPU裡內置一塊NPU,作為AI加速的附加模組,算力普遍在四五十TOPS。GPU仍然是“外掛”。

RTX Spark重新分配了話語權。這顆SoC把GPU變成主角,CPU退居配角。英偉達給出的AI算力是1 petaflop FP4,相當於1000 TOPS,是上一代AI PC內置NPU算力的20倍以上。這不是同一條賽道上的提速,是另一條賽道的起跑。

OEM廠商的跟進速度印證了這個判斷。根據英偉達官方公告和DIGITIMES的後續報導,華碩、戴爾、惠普、聯想、微軟Surface和微星將在今年秋季推出搭載RTX Spark的輕薄筆記本和緊湊型台式機,宏碁與技嘉的型號隨後跟進。主流Windows PC品牌幾乎全部入局。

image

RTX Spark並不是從零誕生的產品。2025年初,同樣的Blackwell加Grace核心芯片曾以Project DIGITS和DGX Spark的形態亮相,但當時定位是面向開發者的Linux桌面超算,體積接近一台小型台式機。一年後,這套架構被壓進了輕薄本的散熱空間裡,作業系統從Linux換成了Windows,目標用戶從AI開發者擴展到了普通消費者和企業用戶。這才是GTC 2026消費級發布中最值得注意的變化:英偉達不是在發布一個開發者玩具,而是在推開消費級市場的大門。

120B模型跑在本地,夠用嗎

算力和內存的數字最終要回答一個問題:能做什麼?

英偉達在發布會上給出的答案是,RTX Spark支持本地運行120B參數的大模型,上下文窗口可以達到百萬token。120B是什麼概念?作為參照,當前消費級硬體跑本地模型的主流實踐是,24GB顯存的RTX 4090通過量化壓縮可以跑30B到40B參數級別的模型。部分小的模型,在消費級顯卡上可以快速跑起來的是9B模型。从9B到120B,這個跳躍幅度讓端側AI的“夠用”標準被重新劃定了。

128GB統一內存是這一切的前提。在傳統PC架構上,CPU有自己的系統內存,GPU有自己的顯存,兩者之間有物理邊界。一個超過顯存容量的大模型要麼根本跑不了,要麼需要複雜的模型拆分和內存交換,速度急劇下降。統一內存架構消除了這個瓶頸,模型數據直接放進128GB的共享池子裡,CPU和GPU都能訪問。蘋果在Apple Silicon上率先證明了這條技術路線的消費級可行性,現在英偉達把它帶到了Windows陣營。

除了大模型推理,英偉達列出的用例還包括12K視頻編輯、90GB以上的3D場景渲染、1440p分辨率下超過100fps的光線追踪遊戲。這些場景的共同特點是單次處理的數據量極大,傳統PC要麼需要數倍於處理時間的等待,要麼根本跑不動。

“支持運行”和“流暢可用”之間還有一段距離。英偉達沒有公布120B模型在RTX Spark上的實際推理速度,也沒有給出百萬token上下文場景下的首token延遲數據。決定長上下文推理速度的關鍵指標是內存帶寬。作為參照,同樣使用GB10核心的DGX Spark在實測中內存帶寬約為301GB/s。這個帶寬水平跑120B模型是可以的,但處理百萬token級別的上下文窗口時,使用者可能需要等待數秒才能看到第一個輸出token。RTX Spark的筆記本版本可能因為功耗限制,實際帶寬還會有所調整。

給AI代理加一道安全籠

算力之外的另一個核心發布,是英偉達與微軟在系統層面的合作。這部分可能是GTC 2026消費級發布中最容易被忽視、但對產業影響最深的內容。

一台能跑120B模型的電腦,如果交給一個可以自主操作桌面、點擊按鈕、讀寫文件的AI代理來使用,安全風險就不再是“會不會丟資料”這個級別了,而是“代理會不會做你不希望它做的事”。這個問題不解決,企業不可能把這種設備部署給員工。

微軟和英偉達給出的方案是兩道防線。第一道,微軟升級了Windows的原生安全機制,從作業系統層面為AI代理行為提供監控和約束。第二道,英偉達把OpenShell運行時正式引入Windows平台。根據英偉達的官方文件,OpenShell是一個開源的沙盒運行時,提供內核級隔離。它給AI代理圈定了一個可控的操作範圍,代理可以在這個範圍內自主執行任務,但權限被嚴格限定,不能越界訪問系統核心文件、網路連接或用戶敏感數據。

這個組合對企業採購的意義是明確的。在此之前,“本地AI代理”這個概念停留在技術演示階段。硬體跑得動,安全框架是空的。沒有企業IT部門敢把這種狀態下的設備納入採購清單。英偉達和微軟在硬體和應用之間插入一層標準化的隔離層,把“能用”變成了“可管理”。

OpenShell本身的性能開銷是一個待觀察的變數。沙盒隔離通常會帶來一定程度的性能損失,具體會影響多少推理速度或系統反應,英偉達目前沒有公開數據。企業IT管理端的部署複雜度、與現有安全策略的相容性,這些實際落地中的問題需要等到OEM設備上市後才能驗證。

Adobe為什麼願意“從底層重構”

軟體廠商的配合程度,通常是判斷一個新硬體平台能否站穩腳跟的風向標。

Adobe在GTC期間宣布的動作是這輪發布中軟體端最大的信號。根據英偉達官方部落格和Adobe高管的確認,Adobe啟動了Photoshop和Premiere的底層重構,專門適配RTX Spark的統一內存架構,宣稱AI與圖形處理性能提升可達2倍。

“底層重構”不是加個插件、做個適配層。在傳統PC上,CPU、GPU各有自己的內存空間,處理一個超大PSD文件或8K視頻時間線時,數據要在兩套內存之間反覆搬運,這是性能浪費的重災區。RTX Spark的統一內存讓CPU和GPU可以直接共享同一塊128GB空間,這個結構變化對專業創作者的工作流程有實際價值。Adobe為此動底層代碼,說明它認可這個架構方向不是一次性的行銷噱頭。

不過,這個“2倍加速”的對比基準是什麼,英偉達和Adobe都沒有公布。是跟同代的x86處理器加獨立顯卡比,還是跟上一代AI PC的NPU方案比?結果截然不同。在基準測試條件公開之前,這個數字的含金量只能打一個問號。

同時宣布支持的還有Blackmagic Design、ComfyUI、llama.cpp、OTOY以及多家遊戲廠商。ComfyUI和llama.cpp的跟進值得注意,因為它們是當前本地AI工作流中最活躍的開源工具。開發者社群的早期支持往往比大廠的承諾更真實地反映一個平台的生態潛力。

英偉達正在用CUDA生態和統一內存架構,在Windows陣營構建類似蘋果軟硬體一體的體驗。區別在於,蘋果的圍牆是自己砌的,英偉達需要說服微軟和ISV們一起砌。Adobe願意從底層動手,至少說明這堵牆的第一塊磚垒上去了。

紙面參數之外

回到一個最實際的問題:這些設備到底能不能買到,買到手是什麼體驗?

根據英偉達公布的信息,首批RTX Spark設備將在今年秋季上市,涵蓋華碩、戴爾、惠普、聯想、微軟Surface和微星的輕薄筆記本與緊湊型台式機。宏碁和技嘉的型號此後跟進。所有OEM的具體定價和確切上市日期都沒有公布。

比定價更關鍵的是幾個物理層面的未知數。把1 petaflop算力的芯片塞進輕薄筆記本,功耗和散熱怎麼平衡?RTX Spark在非AI場景下的日常辦公性能和續航表現如何?128GB統一內存存在筆記本形態下的實際帶寬會不會因為功耗限制而明顯縮水?

這些問題是工業化落地的真正考驗。一顆芯片在工程樣機上的峰值算力和它在消費者手中每天8小時的實際表現,往往是兩回事。英偉達在發布會上強調了RTX Spark的能效比,但沒有給出具體的TDP數值或續航數據。

從PC產業格局的角度看,RTX Spark的出現標誌著一種新的分工模式正在成形。過去三十年,PC的核心芯片話語權掌握在x86處理器廠商手裡,GPU廠商雖然越來越重要,但始終是“插在主板上的配件”。英偉達這次拿出的是一顆完整的SoC,從CPU到GPU到內存控制器全部集成,Arm架構的CPU部分由聯發科設計。PC產業鏈的權力結構,正在從“x86 CPU加上可選的GPU”轉向“以GPU為中心的SoC平台”。

這個轉向不會在一天之內完成。OEM的定價策略、實際產品的能效表現、ISV軟體的適配進度、企業客戶的採購驗證週期,每一個環節都決定RTX Spark是成為PC產業的新坐標,還是另一個高開低走的技術演示。答案至少要等到今年秋天。

NVDAX-1.36%
AAPLX2.77%
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆