Google 補發布 Gemma 4 家族中間缺口：12B 參數的新模型只需 16GB 記憶體即可在消費級筆電本地執行，官方跑分逼近兩倍大的 26B MoE 版本。
（前情提要：Google 推出全新 AI 應用 Dreambeans！把你的日常生活變成限量版「卡通故事」）
（背景補充：Google 猛砸 AI！Alphabet 擴大股權融資至 850 億鎂，獲波克夏百億美元注資）

6月 3 日，Google 發布 Gemma 4 12B，該模型需要的硬體門檻，不需要一台動輒兩萬美元的 AI 加速器，只要電腦有 16GB 的系統記憶體（RAM）或顯示卡記憶體（VRAM）就能在本地執行。

Gemma 4 家族的那塊空缺

今年 4 月，Google 首發 Gemma 4 家族共四款模型：針對行動裝置最佳化的 E2B 和 E4B，以及面向伺服器端的 26B MoE 與 31B Dense。這是一條覆蓋輕量邊緣到重量雲端的產品線，但中間留了一個明顯的空缺，行動裝置版太輕，26B 以上又需要相當規格的硬體，本地筆電場景幾乎沒有選項。

12B 正是為填上這個位置而生。

補充說明一下。26B MoE 是「混合專家模型」，MoE 的意思是：模型按需呼叫部分專家神經元，不必每次推論都動員全部參數。簡單來說就是，這種架構讓模型在計算時只啟動一個子集，26B 版每個 token 實際只用到約 4B 的參數。但代價是：全部 260 億參數仍必須事先載進記憶體以維持路由與推論速度，記憶體佔用因此接近一個同等大小的稠密模型。

31B Dense 則是「稠密模型」，每次推論都動用全部參數的傳統架構。簡單來說就是，沒有節省，每一次回答都是全力出擊。相比之下，Gemma 4 12B 的實際記憶體佔用約 8.1GB，大約是 26B MoE 的一半。

同時，Gemma 4 家族沿用今年改採的 Apache 2.0 授權，這是一種允許商業使用、修改和再發布的開放授權，開發者可以直接拿來跑自己的產品，不需要逐案申請授權。

「幾乎一樣強」

Google 在公告中宣稱，Gemma 4 12B 在多項基準測試上的表現「幾乎一樣強」，足以媲美兩倍大的 26B MoE。官方跑分涵蓋 GPQA Diamond（研究生級科學推理）、MMLU Pro（多領域知識）、DocVQA（文件視覺問答）等指標，數字確實逼近 26B 版本。

不過這幾個數字有幾個地方值得保留判斷。

首先，這是 Google 自評的官方跑分，尚未經過獨立第三方完整複現。基準分數是起跑線，不是終點線，實際應用場景的差距可能比分數顯示的更大或更小。其次，「16GB 可跑」在技術上屬實，但實測記憶體佔用約 8.1GB，對一台同時開著瀏覽器、文書軟體的日常筆電來說，剩餘空間偏緊，不是人人都能順跑。

Gemma 4 12B 也是一個多模態模型，採用無編碼器的統一架構，意思是同一套模型能直接處理文字、圖片、音訊和影片輸入，不需要分別掛載額外的編碼元件。

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。

報酬
いいね
コメント
リポスト
共有

コメントを追加

コメントなし

人気の話題
もっと見る
#
ShareYourUSStocksWinNvidia
3.39M 人気度
#
PredictNBAChampionWin20000U
1.99M 人気度
#
IsraelStrikesIranBTCPlunges
53.52K 人気度
#
ETHPlunges5PercentBelow1800
178.29M 人気度
#
HYPEHitsAllTimeHigh
9.44M 人気度

ピン留め

サイトマップ

Google は Gemma 4 12B オープンソースモデルをリリースし、16GB のコンシューマー向けノートパソコンでローカルに動作可能

Gemma 4 家族的那塊空缺

「幾乎一樣強」

人気の話題

ShareYourUSStocksWinNvidia

PredictNBAChampionWin20000U

IsraelStrikesIranBTCPlunges

ETHPlunges5PercentBelow1800

HYPEHitsAllTimeHigh

ピン留め