Claude Mythos讓梁文鋒決定融資

robot
摘要生成中

什麼是DeepSeek開啟融資的直接導火索?

The Information最新消息曝光:梁文鋒看到Claude Mythos透過海量算力和數據訓練出超強能力,意識到DeepSeek不儲備彈藥根本沒法打下去了。

Anthropic今年4月發布第一個預覽,DeepSeek融資傳聞也是4月中旬第一次傳出。

時間線,剛好對得上。

DeepSeek三百人團隊要翻倍

融資完成後,DeepSeek本週四罕見地發了一則公開聲明:

所有部門招人「至少翻倍」,覆蓋AI系統開發、基礎設施、產品開發和深度學習研究。

目前DeepSeek全公司約300人。

其中負責把模型轉化為自主AI智能體的核心部門 Harness團隊,已經進入每天面試的狀態。

該團隊負責人崔天一今年3月從Jane Street跳槽加入,本月早些時候在X上透露了這一節奏。

與此同時,DeepSeek正在加緊適配國產晶片,梁文鋒相信華為晶片幾年內就能追上輝達的水平,DeepSeek應該率先完成適配。

華為去年才得知DeepSeek在私下試驗自家晶片後,開始與其直接合作。

但適配的代價不小。

DeepSeek的訓練和部署系統是圍繞輝達CUDA軟體搭建的,工程師必須重寫底層軟體才能讓模型在華為晶片上高效運行。

這直接導致DeepSeek長達15個月沒有發布任何新一代模型,在其他頂級實驗室兩三個月就發一次新模型的時代,這個空窗期格外扎眼。

這也讓DeepSeek錯過了去年下半年Anthropic Claude Code掀起的編程工具熱潮。

但梁文鋒在路演中對投資人說,編程工具和AI聊天機器人一樣,都只是AI進化中的臨時產物,如果重注押在這些短期產品上,會偏離通往AGI的終極目標。

「AI不應該被少數人控制」

2023年他確實見過投資人,但當他告訴對方DeepSeek只做深度研究和科學探索、沒有任何商業化或產品路線圖時,投資人紛紛打了退堂鼓。

最後梁文鋒自己掏錢養活了這個實驗室,一養就是三年。

這次74億美元的融資中,梁文鋒自己寫了最大的一張支票:200億人民幣(約30億美元),佔總額的五分之二。

融資完成後,DeepSeek設立了員工持股計劃,按實際估值分配股份。

梁文鋒告訴身邊人,他的戰略不會變:繼續開源、保持低價、專注AGI。他把AGI定義為機器在理解、推理、學習、規劃和適應等廣泛任務上達到人類水平。

他還告訴身邊人,AI不應該被少數人控制。

DeepSeek是目前唯一一家將所有模型底層代碼完全公開的主要AI實驗室。

在美國開發者群體中,DeepSeek的存在感正在急速膨脹。今年4月發布的旗艦模型V4,5月在Vercel的AI Gateway平台上token用量份額從不到1%飆升至17%,一個月內成為該平台僅次於Anthropic和Google的第三大模型。

輕量版V4 Flash的價格比Anthropic模型便宜20到50倍。

這種增長在6月仍在繼續。

本文來源:量子位

風險提示及免責條款

        市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆
  • 已置頂