DeepSeek 為其主要聊天機器人新增圖像和視頻識別功能

一家中國人工智能公司已在其主要聊天機器人中加入了圖像和視頻識別功能。

同時,本地芯片製造商展示了他們現在可以匹配曾經是美國優勢的快速推出支持。

總部位於杭州的DeepSeek公司悄然在其聊天平台上新增了一個名為“圖像識別模式”的新功能。這個新模式加入了該公司本月早些時候推出的另外兩個模式:“專家”和“閃電”。

新功能允許聊天機器人理解照片和視頻,而不僅僅是文本。

這使其與其他已經提供類似能力的主要AI聊天機器人保持一致。

DeepSeek多模態團隊負責人陳曉康表示,該工具最初在網站和移動應用上與少數用戶進行測試。

該公司的高級研究員陳德利在一篇短文中慶祝了這一發布,並提到公司的標誌:“小鯨魚現在可以看見了。”

圖像和視頻功能的推出,距離DeepSeek發布其最新旗艦型號DeepSeek-V4的預覽並向任何人開放模型權重僅過了幾天。

V4不是一個模型,而是兩個。第一個是DeepSeek-V4-Pro,擁有1.6萬億參數,專為需要複雜推理和多步自動化流程的艱難任務設計。

第二個是DeepSeek-V4-Flash,旨在以較低成本處理大量請求。這兩個模型都支持一百萬個令牌的上下文窗口。

它們還採用了公司稱能降低推理時計算能力和內存需求的混合注意力設計。

中國芯片製造商達到新里程碑

許多行業觀察者注意到的不僅是模型本身,而是發布當天發生的事情。

華為昇騰、寒武紀、海光信息和摩爾線程四家中國芯片公司都確認,他們的硬件從模型發布的第一天起就能完美支持V4。

這種“當天支持”,即新模型在非NVIDIA芯片上順利運行,而不是幾週或幾個月之後,過去幾乎是不可能實現的,除非是在Nvidia的生態系統內。

華為的昇騰芯片,包括A2、A3和950,支持V4-Pro和V4-Flash。

該公司表示,其昇騰950芯片利用融合計算流程和並行處理流來加快推理速度。

寒武紀則使用開源的vLLM推理框架完成了適配,並在GitHub上分享了其代碼。

海光表示,它在其DCU平台上進行了深度模型優化,為模型發布到實際應用提供了順暢的路徑。

摩爾線程與北京人工智能研究院合作,使用FlagOS軟件堆棧在其MTT S5000卡上運行V4。

行業觀察者表示,這次協調發佈代表了一個真正的變化。

多年前,非Nvidia生態系統製造的芯片支持一個重大新模型通常需要數月時間。而讓八個不同的國產芯片在第一天就能運行,則是一個重要的里程碑。

大局觀:DeepSeek的成本與自主

觀察者認為,這次發布的更深層意義在於,DeepSeek已經展示了它可以在不依賴西方硬件的情況下提供高水平的AI。

通過讓其模型在多款中國芯片上原生運行,同時降低了因出口限制阻礙中國企業獲取最強大美國處理器的風險。

成本也是一個重要因素。DeepSeek一直努力保持其模型運行成本的低廉,這使企業更容易建立自動化系統,而不必面對高昂的計算費用。

因此,DeepSeek的升級和發布不僅僅是技術上的突破,更是整個供應鏈的整合。

從這次發布開始,AI領域的領導者似乎正從“誰能打造最聰明的模型”轉向“誰能長期以低成本自主運行整個系統”。

如果你正在閱讀這個,你已經領先一步。請持續關注我們的電子報。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆