OpenRouter点名多个代表:DeepSeek V4 Flash用超便宜价格打进真实agentic流程、GLM 5.2以Artificial Analysis评测第一名接下品质王座、辉达Nemotron 3 Ultra代表完全开放的美国队。 (前情提要:AI高定价时代终结倒数?Token必会降价的五大结构性理由) (背景补充:Anthropic全面封杀中国!中资海内外公司均禁止使用Claude,拉起国安防线)
本文目录
Toggle
两年前,开放权重的王座还属于Meta的Llama。如今全世界最大的中立LLM路由器OpenRouter数据显示:Llama已彻底跌出榜单。截至2026年5月,中国的开放权重模型已吃下该平台约61%的token消耗,光是DeepSeek单周就占掉百分之十七点六。
格局翻转的背后,是一个被低估的事实:开放权重模型的智慧与能力,稳定维持在美国前沿实验室身后三到六个月,而且这道差距没有在扩大。对任何把云端账单摊开来看的组织来说,把工作负载从前沿模型搬到开放权重,省下的是真金白银。
DeepSeek V4 Flash是第一个被团队直接丢进真实agentic流程、当成Anthropic或OpenAI级前沿模型替代品来用的开放权重模型。更大的V4 Pro版在SWE-bench Verified拿下八成零六,是开放权重最高分(SWE-bench Verified白话就是说,一套用真实GitHub程序修补任务来考模型会不会写程序的考卷)
**DeepSeek V4-Pro **
DeepSeek R1 (深度推理与思考专家)
DeepSeek V4-Flash (极速与低成本首选)
缓存命中是指:当重复输入相同提示词或历史对话时,输入费用会大幅降低70%至90%。
由z-ai在六月中发布的开放模型GLM 5.2,被第三方评测机构Artificial Analysis的Intelligence Index v4.1列为开放权重第一名,五十一分,领先Nemotron 3 Ultra的四十八分、MiniMax M3与DeepSeek V4 Pro的四十四分,只比封闭的Claude Fable 5低约五分。在更贴近真实情境的agentic评测GDPval-AA上,它约与GPT-5.5同级。
它的长处是规划。架构设计、整个repo规模的重构、跑很久的长程agent任务,GLM 5.2是目前最接近Opus风格的可携替代品。代价是它很爱想:OpenRouter加权平均实际定价每百万token 0.447美元输入、3.31美元输出。
更耐人寻味的是时机。GLM 5.2登场的前几天,美国一纸出口管制指令,逼得Anthropic为了防止外国国民存取而广泛停用Fable 5与Mythos 5。一边是封闭模型因地缘政治说断就断,一边是MIT授权、接近前沿、谁都能自架的开放权重。
开放权重不只产自中国,辉达近期也释出Nemotron 3 Ultra,它在同一份榜单拿四十八分,是最强的美国开放权重,仅次GLM 5.2。
5500亿参数、550亿active,混合Mamba-2与Transformer架构,采OpenMDW授权;OpenMDW白话就是说,不只放权重,连训练数据、配方、评测工具一起开源。辉达的算盘很直白:开放模型用得越多,跑这些模型的Blackwell芯片、CUDA与企业服务就卖得越多。
164.65万 热度
35.41万 热度
12.91万 热度
19.62万 热度
100.59万 热度
OpenRouter:中美 AI 差距只有 3~6 个月,开源模型正席卷世界
OpenRouter点名多个代表:DeepSeek V4 Flash用超便宜价格打进真实agentic流程、GLM 5.2以Artificial Analysis评测第一名接下品质王座、辉达Nemotron 3 Ultra代表完全开放的美国队。
(前情提要:AI高定价时代终结倒数?Token必会降价的五大结构性理由)
(背景补充:Anthropic全面封杀中国!中资海内外公司均禁止使用Claude,拉起国安防线)
本文目录
Toggle
两年前,开放权重的王座还属于Meta的Llama。如今全世界最大的中立LLM路由器OpenRouter数据显示:Llama已彻底跌出榜单。截至2026年5月,中国的开放权重模型已吃下该平台约61%的token消耗,光是DeepSeek单周就占掉百分之十七点六。
格局翻转的背后,是一个被低估的事实:开放权重模型的智慧与能力,稳定维持在美国前沿实验室身后三到六个月,而且这道差距没有在扩大。对任何把云端账单摊开来看的组织来说,把工作负载从前沿模型搬到开放权重,省下的是真金白银。
DeepSeek把价格打到地板
DeepSeek V4 Flash是第一个被团队直接丢进真实agentic流程、当成Anthropic或OpenAI级前沿模型替代品来用的开放权重模型。更大的V4 Pro版在SWE-bench Verified拿下八成零六,是开放权重最高分(SWE-bench Verified白话就是说,一套用真实GitHub程序修补任务来考模型会不会写程序的考卷)
**DeepSeek V4-Pro **
DeepSeek R1 (深度推理与思考专家)
DeepSeek V4-Flash (极速与低成本首选)
缓存命中是指:当重复输入相同提示词或历史对话时,输入费用会大幅降低70%至90%。
GLM接下品质王座
由z-ai在六月中发布的开放模型GLM 5.2,被第三方评测机构Artificial Analysis的Intelligence Index v4.1列为开放权重第一名,五十一分,领先Nemotron 3 Ultra的四十八分、MiniMax M3与DeepSeek V4 Pro的四十四分,只比封闭的Claude Fable 5低约五分。在更贴近真实情境的agentic评测GDPval-AA上,它约与GPT-5.5同级。
它的长处是规划。架构设计、整个repo规模的重构、跑很久的长程agent任务,GLM 5.2是目前最接近Opus风格的可携替代品。代价是它很爱想:OpenRouter加权平均实际定价每百万token 0.447美元输入、3.31美元输出。
更耐人寻味的是时机。GLM 5.2登场的前几天,美国一纸出口管制指令,逼得Anthropic为了防止外国国民存取而广泛停用Fable 5与Mythos 5。一边是封闭模型因地缘政治说断就断,一边是MIT授权、接近前沿、谁都能自架的开放权重。
美国队:辉达Nemotron 3 Ultra
开放权重不只产自中国,辉达近期也释出Nemotron 3 Ultra,它在同一份榜单拿四十八分,是最强的美国开放权重,仅次GLM 5.2。
5500亿参数、550亿active,混合Mamba-2与Transformer架构,采OpenMDW授权;OpenMDW白话就是说,不只放权重,连训练数据、配方、评测工具一起开源。辉达的算盘很直白:开放模型用得越多,跑这些模型的Blackwell芯片、CUDA与企业服务就卖得越多。