Google 補發布 Gemma 4 家族中間缺口:12B 參數的新模型只需 16GB 記憶體即可在消費級筆電本地執行,官方跑分逼近兩倍大的 26B MoE 版本。 (前情提要:Google 推出全新 AI 應用 Dreambeans!把你的日常生活變成限量版「卡通故事」) (背景補充:Google 猛砸 AI!Alphabet 擴大股權融資至 850 億鎂,獲波克夏百億美元注資)
6月 3 日,Google 發布 Gemma 4 12B,該模型需要的硬體門檻,不需要一台動輒兩萬美元的 AI 加速器,只要電腦有 16GB 的系統記憶體(RAM)或顯示卡記憶體(VRAM)就能在本地執行。
今年 4 月,Google 首發 Gemma 4 家族共四款模型:針對行動裝置最佳化的 E2B 和 E4B,以及面向伺服器端的 26B MoE 與 31B Dense。這是一條覆蓋輕量邊緣到重量雲端的產品線,但中間留了一個明顯的空缺,行動裝置版太輕,26B 以上又需要相當規格的硬體,本地筆電場景幾乎沒有選項。
12B 正是為填上這個位置而生。
補充說明一下。26B MoE 是「混合專家模型」,MoE 的意思是:模型按需呼叫部分專家神經元,不必每次推論都動員全部參數。簡單來說就是,這種架構讓模型在計算時只啟動一個子集,26B 版每個 token 實際只用到約 4B 的參數。但代價是:全部 260 億參數仍必須事先載進記憶體以維持路由與推論速度,記憶體佔用因此接近一個同等大小的稠密模型。
31B Dense 則是「稠密模型」,每次推論都動用全部參數的傳統架構。簡單來說就是,沒有節省,每一次回答都是全力出擊。相比之下,Gemma 4 12B 的實際記憶體佔用約 8.1GB,大約是 26B MoE 的一半。
同時,Gemma 4 家族沿用今年改採的 Apache 2.0 授權,這是一種允許商業使用、修改和再發布的開放授權,開發者可以直接拿來跑自己的產品,不需要逐案申請授權。
Google 在公告中宣稱,Gemma 4 12B 在多項基準測試上的表現「幾乎一樣強」,足以媲美兩倍大的 26B MoE。官方跑分涵蓋 GPQA Diamond(研究生級科學推理)、MMLU Pro(多領域知識)、DocVQA(文件視覺問答)等指標,數字確實逼近 26B 版本。
不過這幾個數字有幾個地方值得保留判斷。
首先,這是 Google 自評的官方跑分,尚未經過獨立第三方完整複現。基準分數是起跑線,不是終點線,實際應用場景的差距可能比分數顯示的更大或更小。其次,「16GB 可跑」在技術上屬實,但實測記憶體佔用約 8.1GB,對一台同時開著瀏覽器、文書軟體的日常筆電來說,剩餘空間偏緊,不是人人都能順跑。
Gemma 4 12B 也是一個多模態模型,採用無編碼器的統一架構,意思是同一套模型能直接處理文字、圖片、音訊和影片輸入,不需要分別掛載額外的編碼元件。
3.39M 人気度
1.99M 人気度
53.52K 人気度
178.29M 人気度
9.44M 人気度
Google は Gemma 4 12B オープンソースモデルをリリースし、16GB のコンシューマー向けノートパソコンでローカルに動作可能
Google 補發布 Gemma 4 家族中間缺口:12B 參數的新模型只需 16GB 記憶體即可在消費級筆電本地執行,官方跑分逼近兩倍大的 26B MoE 版本。
(前情提要:Google 推出全新 AI 應用 Dreambeans!把你的日常生活變成限量版「卡通故事」)
(背景補充:Google 猛砸 AI!Alphabet 擴大股權融資至 850 億鎂,獲波克夏百億美元注資)
6月 3 日,Google 發布 Gemma 4 12B,該模型需要的硬體門檻,不需要一台動輒兩萬美元的 AI 加速器,只要電腦有 16GB 的系統記憶體(RAM)或顯示卡記憶體(VRAM)就能在本地執行。
Gemma 4 家族的那塊空缺
今年 4 月,Google 首發 Gemma 4 家族共四款模型:針對行動裝置最佳化的 E2B 和 E4B,以及面向伺服器端的 26B MoE 與 31B Dense。這是一條覆蓋輕量邊緣到重量雲端的產品線,但中間留了一個明顯的空缺,行動裝置版太輕,26B 以上又需要相當規格的硬體,本地筆電場景幾乎沒有選項。
12B 正是為填上這個位置而生。
補充說明一下。26B MoE 是「混合專家模型」,MoE 的意思是:模型按需呼叫部分專家神經元,不必每次推論都動員全部參數。簡單來說就是,這種架構讓模型在計算時只啟動一個子集,26B 版每個 token 實際只用到約 4B 的參數。但代價是:全部 260 億參數仍必須事先載進記憶體以維持路由與推論速度,記憶體佔用因此接近一個同等大小的稠密模型。
31B Dense 則是「稠密模型」,每次推論都動用全部參數的傳統架構。簡單來說就是,沒有節省,每一次回答都是全力出擊。相比之下,Gemma 4 12B 的實際記憶體佔用約 8.1GB,大約是 26B MoE 的一半。
同時,Gemma 4 家族沿用今年改採的 Apache 2.0 授權,這是一種允許商業使用、修改和再發布的開放授權,開發者可以直接拿來跑自己的產品,不需要逐案申請授權。
「幾乎一樣強」
Google 在公告中宣稱,Gemma 4 12B 在多項基準測試上的表現「幾乎一樣強」,足以媲美兩倍大的 26B MoE。官方跑分涵蓋 GPQA Diamond(研究生級科學推理)、MMLU Pro(多領域知識)、DocVQA(文件視覺問答)等指標,數字確實逼近 26B 版本。
不過這幾個數字有幾個地方值得保留判斷。
首先,這是 Google 自評的官方跑分,尚未經過獨立第三方完整複現。基準分數是起跑線,不是終點線,實際應用場景的差距可能比分數顯示的更大或更小。其次,「16GB 可跑」在技術上屬實,但實測記憶體佔用約 8.1GB,對一台同時開著瀏覽器、文書軟體的日常筆電來說,剩餘空間偏緊,不是人人都能順跑。
Gemma 4 12B 也是一個多模態模型,採用無編碼器的統一架構,意思是同一套模型能直接處理文字、圖片、音訊和影片輸入,不需要分別掛載額外的編碼元件。