DeepSeek开源V4模型,参数规模达1.6万亿

robot
摘要生成中

Odaily星球日报讯 DeepSeek 发布 V4 系列开源模型预览版,采用 MIT 许可,权重已上线 Hugging Face 与 ModelScope。

该系列包含两款 MoE 模型,其中 V4-Pro 总参数约 1.6 万亿、单 token 激活 490 亿参数,V4-Flash 总参数 2840 亿、激活 130 亿参数,均支持 100 万 token 上下文。官方表示,相较 V3.2 版本,其在长文本推理中显存占用与计算开销均显著降低。

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论