一家中国人工智能公司已在其主聊天机器人中加入图像与视频识别能力。
与此同时,当地芯片制造商也展示出,他们如今能够匹配过去曾是美国强项的快速上线支持能力。
总部位于杭州的DeepSeek悄然在其聊天平台新增了一项名为“image recognition mode(图像识别模式)”的新功能。该新模式加入了公司本月早些时候推出的另外两种模式:“expert”和“flash”。
这一新功能使聊天机器人不仅能理解文本,还能理解照片和视频。
这让它与其他一些主要AI聊天机器人在能力方面保持一致——这些机器人早已提供类似功能。
DeepSeek多模态团队负责人陈晓康表示,该工具最初在网站和移动应用上对一小批用户进行了测试。
公司高级研究员陈德利在一则简短帖子中为发布作出庆祝,帖子还提到了公司的标志:“小鲸鱼现在可以看见了。”
图像与视频功能上线距DeepSeek发布其最新旗舰模型DeepSeek-V4预览、并向任何人开放模型权重下载与使用,仅相隔几天。
V4并不是一个模型,而是两个。第一个是DeepSeek-V4-Pro,拥有1.6万亿参数,旨在应对需要复杂推理和多步骤自动化工作流的难题。
第二个是DeepSeek-V4-Flash,面向在更低成本下处理大量请求而打造。两个模型都支持一个上下文窗口,大小为一百万个tokens。
它们还采用混合注意力设计,公司称这能在推理过程中降低所需的计算能力和内存。
中国芯片制造商再创里程碑
吸引众多行业观察者的不只是模型本身,还有它发布当天发生的事。
四家中国芯片公司——Huawei Ascend、Cambricon、Hygon Information和Moore Threads——都确认:它们的硬件从V4发布的第一天起就能与之完美匹配。
过去,这种“同日支持”几乎不可能发生:新模型在发布当时就能在非NVIDIA芯片上顺畅运行,而不是要等几周或几个月之后,才在NVIDIA生态系统之外实现。
华为的Ascend芯片(包括A2、A3和950)同时支持V4-Pro和V4-Flash。
公司表示,其Ascend 950芯片采用融合计算流程和并行处理流水线,从而让推理更快。
Cambricon则通过使用开源的vLLM推理框架完成适配,并在GitHub上共享了代码。
Hygon表示,他们在DCU平台上进行了深度模型优化,以打造从模型发布到实际使用之间的顺畅路径。
Moore Threads与北京人工智能研究院合作,使用FlagOS软件栈在其MTT S5000卡上运行V4。
行业观察人士称,这次协调一致的发布体现了真正的变化。
多年来,在NVIDIA生态系统之外制造的芯片要支持某个重大的新模型,往往需要数月时间。能够让8种不同的国产芯片组在首日就投入使用,是一个重要的里程碑。
更大的图景:Deepseek的成本与自主性
观察者认为,这次发布更深层的意义在于,DeepSeek已证明:无需依赖西方硬件,也能交付高水平AI。
通过让其模型同时原生适配多款中国芯片,它降低了来自出口限制的风险——这些限制曾使中国企业难以获取最强大的美国处理器。
成本同样重要。DeepSeek一直努力将运行其模型的价格控制在较低水平。这使企业更容易构建自动化系统,而无需面对非常高的计算成本。
因此,Deepseek的升级与发布,主要并不只是关于某一次技术突破。更像是整个供应链的协同到位。
从这次发布开始,AI领域的“谁来领导”似乎正从“谁能造出最聪明的模型”转向“谁能在长期内以低成本、独立地让整个系统持续运行”。
如果你正在阅读这段话,你已经领先了。请继续关注我们的新闻简报,在领先的位置保持下去。
62.96万 热度
652.67万 热度
17.23万 热度
12.47万 热度
101.03万 热度
DeepSeek 在其主要聊天机器人中添加了图像和视频识别功能
一家中国人工智能公司已在其主聊天机器人中加入图像与视频识别能力。
与此同时,当地芯片制造商也展示出,他们如今能够匹配过去曾是美国强项的快速上线支持能力。
总部位于杭州的DeepSeek悄然在其聊天平台新增了一项名为“image recognition mode(图像识别模式)”的新功能。该新模式加入了公司本月早些时候推出的另外两种模式:“expert”和“flash”。
这一新功能使聊天机器人不仅能理解文本,还能理解照片和视频。
这让它与其他一些主要AI聊天机器人在能力方面保持一致——这些机器人早已提供类似功能。
DeepSeek多模态团队负责人陈晓康表示,该工具最初在网站和移动应用上对一小批用户进行了测试。
公司高级研究员陈德利在一则简短帖子中为发布作出庆祝,帖子还提到了公司的标志:“小鲸鱼现在可以看见了。”
图像与视频功能上线距DeepSeek发布其最新旗舰模型DeepSeek-V4预览、并向任何人开放模型权重下载与使用,仅相隔几天。
V4并不是一个模型,而是两个。第一个是DeepSeek-V4-Pro,拥有1.6万亿参数,旨在应对需要复杂推理和多步骤自动化工作流的难题。
第二个是DeepSeek-V4-Flash,面向在更低成本下处理大量请求而打造。两个模型都支持一个上下文窗口,大小为一百万个tokens。
它们还采用混合注意力设计,公司称这能在推理过程中降低所需的计算能力和内存。
中国芯片制造商再创里程碑
吸引众多行业观察者的不只是模型本身,还有它发布当天发生的事。
四家中国芯片公司——Huawei Ascend、Cambricon、Hygon Information和Moore Threads——都确认:它们的硬件从V4发布的第一天起就能与之完美匹配。
过去,这种“同日支持”几乎不可能发生:新模型在发布当时就能在非NVIDIA芯片上顺畅运行,而不是要等几周或几个月之后,才在NVIDIA生态系统之外实现。
华为的Ascend芯片(包括A2、A3和950)同时支持V4-Pro和V4-Flash。
公司表示,其Ascend 950芯片采用融合计算流程和并行处理流水线,从而让推理更快。
Cambricon则通过使用开源的vLLM推理框架完成适配,并在GitHub上共享了代码。
Hygon表示,他们在DCU平台上进行了深度模型优化,以打造从模型发布到实际使用之间的顺畅路径。
Moore Threads与北京人工智能研究院合作,使用FlagOS软件栈在其MTT S5000卡上运行V4。
行业观察人士称,这次协调一致的发布体现了真正的变化。
多年来,在NVIDIA生态系统之外制造的芯片要支持某个重大的新模型,往往需要数月时间。能够让8种不同的国产芯片组在首日就投入使用,是一个重要的里程碑。
更大的图景:Deepseek的成本与自主性
观察者认为,这次发布更深层的意义在于,DeepSeek已证明:无需依赖西方硬件,也能交付高水平AI。
通过让其模型同时原生适配多款中国芯片,它降低了来自出口限制的风险——这些限制曾使中国企业难以获取最强大的美国处理器。
成本同样重要。DeepSeek一直努力将运行其模型的价格控制在较低水平。这使企业更容易构建自动化系统,而无需面对非常高的计算成本。
因此,Deepseek的升级与发布,主要并不只是关于某一次技术突破。更像是整个供应链的协同到位。
从这次发布开始,AI领域的“谁来领导”似乎正从“谁能造出最聪明的模型”转向“谁能在长期内以低成本、独立地让整个系统持续运行”。
如果你正在阅读这段话,你已经领先了。请继续关注我们的新闻简报,在领先的位置保持下去。