Google 推出 Gemma 4 12B 开源模型，16GB 消费型笔电就能本地运行

2026-06-04 02:10:14

Google 補发布 Gemma 4 家族中间缺口：12B 參數的新模型只需 16GB 記憶體即可在消费級筆电本地執行，官方跑分逼近两倍大的 26B MoE 版本。
（前情提要：Google 推出全新 AI 应用 Dreambeans！把你的日常生活變成限量版「卡通故事」）
（背景補充：Google 猛砸 AI！Alphabet 擴大股權融资至 850 亿美元，獲得波克夏百亿美元注资）

6月 3 日，Google 发布 Gemma 4 12B，該模型需要的硬體门檻，不需要一台动輒两万美元的 AI 加速器，只要电腦有 16GB 的系统記憶體（RAM）或顯示卡記憶體（VRAM）就能在本地執行。

Gemma 4 家族的那塊空缺

今年 4 月，Google 首发 Gemma 4 家族共四款模型：針对行动裝置最佳化的 E2B 和 E4B，以及面向伺服器端的 26B MoE 与 31B Dense。这是一條覆蓋轻量边緣到重量雲端的产品線，但中间留了一个明顯的空缺，行动裝置版太轻，26B 以上又需要相当規格的硬體，本地筆电场景幾乎沒有选項。

12B 正是为填上这个位置而生。

補充说明一下。26B MoE 是「混合專家模型」，MoE 的意思是：模型按需呼叫部分專家神经元，不必每次推論都动員全部參數。簡單来说就是，这種架構让模型在计算时只啟动一个子集，26B 版每个 token 实际只用到约 4B 的參數。但代价是：全部 260 亿參數仍必須事先載进記憶體以維持路由与推論速度，記憶體佔用因此接近一个同等大小的稠密模型。

31B Dense 則是「稠密模型」，每次推論都动用全部參數的傳统架構。簡單来说就是，沒有節省，每一次回答都是全力出擊。相比之下，Gemma 4 12B 的实际記憶體佔用约 8.1GB，大约是 26B MoE 的一半。

同时，Gemma 4 家族沿用今年改採的 Apache 2.0 授權，这是一種允許商业使用、修改和再发布的开放授權，开发者可以直接拿来跑自己的产品，不需要逐案申请授權。

「幾乎一樣強」

Google 在公告中宣稱，Gemma 4 12B 在多項基準測試上的表现「幾乎一樣強」，足以媲美两倍大的 26B MoE。官方跑分涵蓋 GPQA Diamond（研究生級科学推理）、MMLU Pro（多领域知识）、DocVQA（文件視覺问答）等指標，數字確实逼近 26B 版本。

不过这幾个數字有幾个地方值得保留判斷。

首先，这是 Google 自評的官方跑分，尚未经过獨立第三方完整複现。基準分數是起跑線，不是終点線，实际应用场景的差距可能比分數顯示的更大或更小。其次，「16GB 可跑」在技術上屬实，但实測記憶體佔用约 8.1GB，对一台同时开著瀏覽器、文书软體的日常筆电来说，剩餘空间偏緊，不是人人都能順跑。

Gemma 4 12B 也是一个多模態模型，採用无編碼器的统一架構，意思是同一套模型能直接處理文字、圖片、音訊和影片输入，不需要分別掛載額外的編碼元件。

查看原文

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

赞赏
点赞
评论
转发
分享

请输入评论内容

暂无评论

热门话题
查看更多
#
分享美股交易赢英伟达股票
338.14万热度
#
预测NBA总冠军赢20,000U
199.45万热度
#
ETH跌幅超5%
17822.93万热度
#
HYPE创历史新高
944.76万热度
#
成长值抽奖赢金条
130.24万热度

Google 推出 Gemma 4 12B 开源模型，16GB 消费型笔电就能本地运行

Gemma 4 家族的那塊空缺

「幾乎一樣強」

热门话题

分享美股交易赢英伟达股票

预测NBA总冠军赢20,000U

ETH跌幅超5%

HYPE创历史新高

成长值抽奖赢金条

置顶