DeepSeek V4 将在未来几周推出,完全基于华为芯片运行

robot
摘要生成中

4月4日,美国科技媒体《The Information》的报道称,中国AI初创公司DeepSeek计划发布其下一代旗舰模型V4,该模型将完全由华为自研芯片进行算力运行。这被视为中国推动半导体自主化进程中的重要里程碑。V4预计将在未来几周内发布,并在数月内与华为以及芯片设计公司寒武纪(Cambricon)合作开发;在此期间,模型的底层代码被重写,以确保与国产芯片兼容。值得注意的是,DeepSeek并未向英伟达(Nvidia)提供V4的提前测试访问权限,而是邀请国内芯片公司参与早期优化,打破了行业惯例。阿里巴巴、字节跳动和腾讯等中国科技巨头已经为华为最新的Ascend 950PR芯片下达了大量订单,合计达到数十万颗,意图通过云服务部署V4,并将其集成到自身的AI应用中。需求激增推动该芯片价格上涨约20%。V4采用混合专家(MoE)架构,总参数量约为1万亿;每次推理将激活约370亿参数,支持文本、图像和代码等多模态输入,同时保持低延迟。去年,DeepSeek发布低成本模型V3和R1引发全球科技股出现显著下跌,进而引发争问:美国AI公司是否需要投入数十亿美元的算力。因而,V4已引起了广泛的国际关注。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论