分析:中美開源大模型與閉源前沿差距僅剩3至6個月,極低成本加速全球平替潮

robot
摘要生成中
據動察 Beating 監測,聚合服務商 OpenRouter 揭露,開源模型與閉源前沿模型的性能差距已穩定在 3 至 6 個月。在過去 18 個月中,前沿閉源實驗室未能如預期般拉開身位,而以中美新玩家為代表的開源力量正憑藉極高的性價比加速平替閉源模型。

DeepSeek V4 Flash 發布僅兩個月就成為平替首選。擁有 2840 億參數的 DeepSeek V4 Flash 在 SWE-bench Verified 評測中取得 79.0% 的成績,表現逼近 GPT-5.5 等級。官方第一方輸入/輸出定價僅為 0.14/0.28 美元/百萬 token,輸出成本比 GPT-5.5 便宜約 150 倍。即使加上不保留數據訓練的西方雲託管溢價,實際成本也僅在閉源前沿模型的 1.3% 左右。

除了價格優勢,智譜 2026 年 6 月發布的 GLM 5.2 在 Artificial Analysis 開源權重智能指數中排名第一,並在真實智能體評測中比肩 GPT-5.5 等級,成為長程編程規劃的替換方案。不過,GLM 5.2 在深度思考時較為消耗 token,企業部署時需平衡輸出成本。多模態開源模型 MiniMax M3 則憑藉創新的 MSA 稀疏注意力架構,以較低的代幣價格提供了原生圖像與影片的長上下文處理能力,成為 Gemini Flash 的強勁開源對手。

同時,基於 Mamba-2 混合架構的英偉達 Nemotron 3 Ultra 成為最強的美國本土開源力量,旨在透過開放生態拉動英偉達硬體與微服務生態的市場需求。

OpenRouter 強調,雖然前沿閉源模型最終仍會向前推進,但固定智能水平的代幣成本將持續走低,為企業提供了重大的成本優化空間。
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆