Google 推出 Gemma 4 12B 开源模型,16GB 消费型笔电就能本地运行

Google 補发布 Gemma 4 家族中间缺口:12B 參數的新模型只需 16GB 記憶體即可在消费級筆电本地執行,官方跑分逼近两倍大的 26B MoE 版本。
(前情提要:Google 推出全新 AI 应用 Dreambeans!把你的日常生活變成限量版「卡通故事」)
(背景補充:Google 猛砸 AI!Alphabet 擴大股權融资至 850 亿美元,獲得波克夏百亿美元注资)

6月 3 日,Google 发布 Gemma 4 12B,該模型需要的硬體门檻,不需要一台动輒两万美元的 AI 加速器,只要电腦有 16GB 的系统記憶體(RAM)或顯示卡記憶體(VRAM)就能在本地執行。

Gemma 4 家族的那塊空缺

今年 4 月,Google 首发 Gemma 4 家族共四款模型:針对行动裝置最佳化的 E2B 和 E4B,以及面向伺服器端的 26B MoE 与 31B Dense。这是一條覆蓋轻量边緣到重量雲端的产品線,但中间留了一个明顯的空缺,行动裝置版太轻,26B 以上又需要相当規格的硬體,本地筆电场景幾乎沒有选項。

12B 正是为填上这个位置而生。

補充说明一下。26B MoE 是「混合專家模型」,MoE 的意思是:模型按需呼叫部分專家神经元,不必每次推論都动員全部參數。簡單来说就是,这種架構让模型在计算时只啟动一个子集,26B 版每个 token 实际只用到约 4B 的參數。但代价是:全部 260 亿參數仍必須事先載进記憶體以維持路由与推論速度,記憶體佔用因此接近一个同等大小的稠密模型。

31B Dense 則是「稠密模型」,每次推論都动用全部參數的傳统架構。簡單来说就是,沒有節省,每一次回答都是全力出擊。相比之下,Gemma 4 12B 的实际記憶體佔用约 8.1GB,大约是 26B MoE 的一半。

同时,Gemma 4 家族沿用今年改採的 Apache 2.0 授權,这是一種允許商业使用、修改和再发布的开放授權,开发者可以直接拿来跑自己的产品,不需要逐案申请授權。

「幾乎一樣強」

Google 在公告中宣稱,Gemma 4 12B 在多項基準測試上的表现「幾乎一樣強」,足以媲美两倍大的 26B MoE。官方跑分涵蓋 GPQA Diamond(研究生級科学推理)、MMLU Pro(多领域知识)、DocVQA(文件視覺问答)等指標,數字確实逼近 26B 版本。

不过这幾个數字有幾个地方值得保留判斷。

首先,这是 Google 自評的官方跑分,尚未经过獨立第三方完整複现。基準分數是起跑線,不是終点線,实际应用场景的差距可能比分數顯示的更大或更小。其次,「16GB 可跑」在技術上屬实,但实測記憶體佔用约 8.1GB,对一台同时开著瀏覽器、文书软體的日常筆电来说,剩餘空间偏緊,不是人人都能順跑。

Gemma 4 12B 也是一个多模態模型,採用无編碼器的统一架構,意思是同一套模型能直接處理文字、圖片、音訊和影片输入,不需要分別掛載額外的編碼元件。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论