📢 Gate 广场 | Polymarket 6/4 特别预测:NBA 总决赛,尼克斯 vs 马刺谁能夺冠?
NBA 总决赛火热开打!目前 Polymarket 预测市场上,66% 用户押注马刺,35% 用户看好尼克斯。强强对决,您认为冠军最终花落谁家?
🎁 全民瓜分奖: 参与尼克斯 vs 马刺焦点战预测,瓜分 20,000 USDT 巨额奖池!
👉️ https://www.gate.com/zh/campaigns/5030
🎁 广场专属福利: 抽取 10 位发布优质内容的用户,每人赠送 $5 代币!
📝 参与攻略:
带 #预测NBA总冠军赢20,000U 发帖,选择以下任一方式参与:
🔹 方法 A:预测您心中的夺冠球队,并挂载事件卡片
🔹 方法 B:晒出您的交易截图,分享交易思路与观点
📍注意:选择方法 A 时,需在发帖页-币种图标中挂载对应 Polymarket 事件卡片,才算有效参与。
立即参与:https://gate.onelink.me/Hls0/prediction?page=detail&event_ticker=543443&source=cex
Google 推出 Gemma 4 12B 开源模型,16GB 消费型笔电就能本地运行
Google 補发布 Gemma 4 家族中间缺口:12B 參數的新模型只需 16GB 記憶體即可在消费級筆电本地執行,官方跑分逼近两倍大的 26B MoE 版本。
(前情提要:Google 推出全新 AI 应用 Dreambeans!把你的日常生活變成限量版「卡通故事」)
(背景補充:Google 猛砸 AI!Alphabet 擴大股權融资至 850 亿美元,獲得波克夏百亿美元注资)
6月 3 日,Google 发布 Gemma 4 12B,該模型需要的硬體门檻,不需要一台动輒两万美元的 AI 加速器,只要电腦有 16GB 的系统記憶體(RAM)或顯示卡記憶體(VRAM)就能在本地執行。
Gemma 4 家族的那塊空缺
今年 4 月,Google 首发 Gemma 4 家族共四款模型:針对行动裝置最佳化的 E2B 和 E4B,以及面向伺服器端的 26B MoE 与 31B Dense。这是一條覆蓋轻量边緣到重量雲端的产品線,但中间留了一个明顯的空缺,行动裝置版太轻,26B 以上又需要相当規格的硬體,本地筆电场景幾乎沒有选項。
12B 正是为填上这个位置而生。
補充说明一下。26B MoE 是「混合專家模型」,MoE 的意思是:模型按需呼叫部分專家神经元,不必每次推論都动員全部參數。簡單来说就是,这種架構让模型在计算时只啟动一个子集,26B 版每个 token 实际只用到约 4B 的參數。但代价是:全部 260 亿參數仍必須事先載进記憶體以維持路由与推論速度,記憶體佔用因此接近一个同等大小的稠密模型。
31B Dense 則是「稠密模型」,每次推論都动用全部參數的傳统架構。簡單来说就是,沒有節省,每一次回答都是全力出擊。相比之下,Gemma 4 12B 的实际記憶體佔用约 8.1GB,大约是 26B MoE 的一半。
同时,Gemma 4 家族沿用今年改採的 Apache 2.0 授權,这是一種允許商业使用、修改和再发布的开放授權,开发者可以直接拿来跑自己的产品,不需要逐案申请授權。
「幾乎一樣強」
Google 在公告中宣稱,Gemma 4 12B 在多項基準測試上的表现「幾乎一樣強」,足以媲美两倍大的 26B MoE。官方跑分涵蓋 GPQA Diamond(研究生級科学推理)、MMLU Pro(多领域知识)、DocVQA(文件視覺问答)等指標,數字確实逼近 26B 版本。
不过这幾个數字有幾个地方值得保留判斷。
首先,这是 Google 自評的官方跑分,尚未经过獨立第三方完整複现。基準分數是起跑線,不是終点線,实际应用场景的差距可能比分數顯示的更大或更小。其次,「16GB 可跑」在技術上屬实,但实測記憶體佔用约 8.1GB,对一台同时开著瀏覽器、文书软體的日常筆电来说,剩餘空间偏緊,不是人人都能順跑。
Gemma 4 12B 也是一个多模態模型,採用无編碼器的统一架構,意思是同一套模型能直接處理文字、圖片、音訊和影片输入,不需要分別掛載額外的編碼元件。