广场
最新
热门
资讯
我的主页
发布
魂淡哥
2026-04-24 03:54:27
关注
DeepSeek V4终于发布了!
对比了一下
目前是当前开源最强大模型了
在代码、数学、长文本、Agent四大领域达到全球第一梯队,部分指标超越GPT-4o、Claude Opus 4.6。
一、版本与定位
- V4-Pro:旗舰,对标GPT-4o/Opus 4.6,开源最强。
- V4-Flash:轻量高速,性价比高。
- 架构:1.6T参数MoE,每次激活约370B;100万Token上下文。
- 算力:全栈华为昇腾950PR,去英伟达化。
二、核心性能对比(权威评测)
1️⃣ 编程(最强项)
- HumanEval:90%(>Opus 4.5 88%、>GPT-4 82%)。
- SWE-Bench:>80%,真实软件工程能力领先。
- 结论:全球最强AI程序员。
2️⃣ 数学/推理
- MATH/STEM:超越所有开源模型,比肩GPT-4o/Opus 4.6。
- Agent能力:Agentic Coding达开源最佳,优于Claude Sonnet 4.5,接近Opus 4.6(非思考模式)。
3️⃣ 长文本
- 上下文:1M Token(≈70万汉字),全球前三(仅次于Gemini 3.1)。
- 实测:百万字小说/整库分析不崩,长文本最强国产模型。
4️⃣ 世界知识
- 领先所有开源模型,略低于Gemini 3.1 Pro。
三、综合排行(2026.4.24)
- 闭源第一梯队:
1. Gemini 3.1 Pro(推理/长文本最强)
2. Claude Opus 4.6(全能均衡)
3. GPT-4o(生态最强)
4. DeepSeek V4-Pro(代码/长文本顶尖,国产第一)
- 开源第一梯队:
- DeepSeek V4-Pro(绝对第一,全面领先Llama 3/Qwen 3)
四、关键优势
- ✅ 代码最强:超越GPT-4o/Claude,工程级任务能力。
- ✅ 1M上下文:长文本处理全球顶级。
- ✅ 国产算力:昇腾全栈,成本仅GPT-4的1/70。
- ✅ 开源可商用:V4-Pro/Flash开源,MIT协议。
五、短板
- 综合能力略逊于Gemini 3.1/Opus 4.6(尤其深度推理)。
- 多模态(图文)能力弱于GPT-4o/Gemini。
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见
声明
。
赞赏
点赞
评论
转发
分享
评论
请输入评论内容
请输入评论内容
评论
暂无评论
热门话题
查看更多
#
Gate股票转仓功能上线
54.65万 热度
#
Circle股价重挫17%
652.35万 热度
#
预测世界杯葡萄牙VS克罗地亚
17.08万 热度
#
GateCard上线积分体系
12.26万 热度
#
非农数据倒计时
92.19万 热度
置顶
网站地图
DeepSeek V4终于发布了!
对比了一下
目前是当前开源最强大模型了
在代码、数学、长文本、Agent四大领域达到全球第一梯队,部分指标超越GPT-4o、Claude Opus 4.6。
一、版本与定位
- V4-Pro:旗舰,对标GPT-4o/Opus 4.6,开源最强。
- V4-Flash:轻量高速,性价比高。
- 架构:1.6T参数MoE,每次激活约370B;100万Token上下文。
- 算力:全栈华为昇腾950PR,去英伟达化。
二、核心性能对比(权威评测)
1️⃣ 编程(最强项)
- HumanEval:90%(>Opus 4.5 88%、>GPT-4 82%)。
- SWE-Bench:>80%,真实软件工程能力领先。
- 结论:全球最强AI程序员。
2️⃣ 数学/推理
- MATH/STEM:超越所有开源模型,比肩GPT-4o/Opus 4.6。
- Agent能力:Agentic Coding达开源最佳,优于Claude Sonnet 4.5,接近Opus 4.6(非思考模式)。
3️⃣ 长文本
- 上下文:1M Token(≈70万汉字),全球前三(仅次于Gemini 3.1)。
- 实测:百万字小说/整库分析不崩,长文本最强国产模型。
4️⃣ 世界知识
- 领先所有开源模型,略低于Gemini 3.1 Pro。
三、综合排行(2026.4.24)
- 闭源第一梯队:
1. Gemini 3.1 Pro(推理/长文本最强)
2. Claude Opus 4.6(全能均衡)
3. GPT-4o(生态最强)
4. DeepSeek V4-Pro(代码/长文本顶尖,国产第一)
- 开源第一梯队:
- DeepSeek V4-Pro(绝对第一,全面领先Llama 3/Qwen 3)
四、关键优势
- ✅ 代码最强:超越GPT-4o/Claude,工程级任务能力。
- ✅ 1M上下文:长文本处理全球顶级。
- ✅ 国产算力:昇腾全栈,成本仅GPT-4的1/70。
- ✅ 开源可商用:V4-Pro/Flash开源,MIT协议。
五、短板
- 综合能力略逊于Gemini 3.1/Opus 4.6(尤其深度推理)。
- 多模态(图文)能力弱于GPT-4o/Gemini。