OpenRouter点名多个代表：DeepSeek V4 Flash用超便宜价格打进真实agentic流程、GLM 5.2以Artificial Analysis评测第一名接下品质王座、辉达Nemotron 3 Ultra代表完全开放的美国队。
（前情提要：AI高定价时代终结倒数？Token必会降价的五大结构性理由）
（背景补充：Anthropic全面封杀中国！中资海内外公司均禁止使用Claude，拉起国安防线）

本文目录

Toggle

DeepSeek把价格打到地板
GLM接下品质王座
美国队：辉达Nemotron 3 Ultra

两年前，开放权重的王座还属于Meta的Llama。如今全世界最大的中立LLM路由器OpenRouter数据显示：Llama已彻底跌出榜单。截至2026年5月，中国的开放权重模型已吃下该平台约61%的token消耗，光是DeepSeek单周就占掉百分之十七点六。

格局翻转的背后，是一个被低估的事实：开放权重模型的智慧与能力，稳定维持在美国前沿实验室身后三到六个月，而且这道差距没有在扩大。对任何把云端账单摊开来看的组织来说，把工作负载从前沿模型搬到开放权重，省下的是真金白银。

DeepSeek把价格打到地板

DeepSeek V4 Flash是第一个被团队直接丢进真实agentic流程、当成Anthropic或OpenAI级前沿模型替代品来用的开放权重模型。更大的V4 Pro版在SWE-bench Verified拿下八成零六，是开放权重最高分（SWE-bench Verified白话就是说，一套用真实GitHub程序修补任务来考模型会不会写程序的考卷）

**DeepSeek V4-Pro **

缓存未命中输入费用：每百万Tokens美金0.30元
缓存命中输入费用：每百万Tokens美金0.03元
输出费用：每百万Tokens美金0.50元

DeepSeek R1 (深度推理与思考专家)

缓存未命中输入费用：每百万Tokens美金0.55元
缓存命中输入费用：每百万Tokens美金0.14元
输出费用：每百万Tokens美金2.19元

DeepSeek V4-Flash (极速与低成本首选)

缓存未命中输入费用：每百万Tokens美金0.14元
缓存命中输入费用：每百万Tokens美金0.0028元
输出费用：每百万Tokens美金0.28元

缓存命中是指：当重复输入相同提示词或历史对话时，输入费用会大幅降低70%至90%。

GLM接下品质王座

由z-ai在六月中发布的开放模型GLM 5.2，被第三方评测机构Artificial Analysis的Intelligence Index v4.1列为开放权重第一名，五十一分，领先Nemotron 3 Ultra的四十八分、MiniMax M3与DeepSeek V4 Pro的四十四分，只比封闭的Claude Fable 5低约五分。在更贴近真实情境的agentic评测GDPval-AA上，它约与GPT-5.5同级。

它的长处是规划。架构设计、整个repo规模的重构、跑很久的长程agent任务，GLM 5.2是目前最接近Opus风格的可携替代品。代价是它很爱想：OpenRouter加权平均实际定价每百万token 0.447美元输入、3.31美元输出。

更耐人寻味的是时机。GLM 5.2登场的前几天，美国一纸出口管制指令，逼得Anthropic为了防止外国国民存取而广泛停用Fable 5与Mythos 5。一边是封闭模型因地缘政治说断就断，一边是MIT授权、接近前沿、谁都能自架的开放权重。

美国队：辉达Nemotron 3 Ultra

开放权重不只产自中国，辉达近期也释出Nemotron 3 Ultra，它在同一份榜单拿四十八分，是最强的美国开放权重，仅次GLM 5.2。

5500亿参数、550亿active，混合Mamba-2与Transformer架构，采OpenMDW授权；OpenMDW白话就是说，不只放权重，连训练数据、配方、评测工具一起开源。辉达的算盘很直白：开放模型用得越多，跑这些模型的Blackwell芯片、CUDA与企业服务就卖得越多。

查看原文

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

赞赏
点赞
评论
转发
分享

请输入评论内容

暂无评论

置顶

OpenRouter：中美 AI 差距只有 3~6 个月，开源模型正席卷世界

DeepSeek把价格打到地板

GLM接下品质王座

美国队：辉达Nemotron 3 Ultra

热门话题

0成本拿2股SK海力士

美光市值超越Meta跻身全美前十

南非VS加拿大

美国5月PCE通胀升至4.1%创三年新高

USD1链上质押享年化9.48%

置顶