什麼是DeepSeek開啟融資的直接導火索?
The Information最新消息曝光:梁文鋒看到Claude Mythos透過海量算力和數據訓練出超強能力,意識到DeepSeek不儲備彈藥根本沒法打下去了。
Anthropic今年4月發布第一個預覽,DeepSeek融資傳聞也是4月中旬第一次傳出。
時間線,剛好對得上。
融資完成後,DeepSeek本週四罕見地發了一則公開聲明:
所有部門招人「至少翻倍」,覆蓋AI系統開發、基礎設施、產品開發和深度學習研究。
目前DeepSeek全公司約300人。
其中負責把模型轉化為自主AI智能體的核心部門 Harness團隊,已經進入每天面試的狀態。
該團隊負責人崔天一今年3月從Jane Street跳槽加入,本月早些時候在X上透露了這一節奏。
與此同時,DeepSeek正在加緊適配國產晶片,梁文鋒相信華為晶片幾年內就能追上輝達的水平,DeepSeek應該率先完成適配。
華為去年才得知DeepSeek在私下試驗自家晶片後,開始與其直接合作。
但適配的代價不小。
DeepSeek的訓練和部署系統是圍繞輝達CUDA軟體搭建的,工程師必須重寫底層軟體才能讓模型在華為晶片上高效運行。
這直接導致DeepSeek長達15個月沒有發布任何新一代模型,在其他頂級實驗室兩三個月就發一次新模型的時代,這個空窗期格外扎眼。
這也讓DeepSeek錯過了去年下半年Anthropic Claude Code掀起的編程工具熱潮。
但梁文鋒在路演中對投資人說,編程工具和AI聊天機器人一樣,都只是AI進化中的臨時產物,如果重注押在這些短期產品上,會偏離通往AGI的終極目標。
2023年他確實見過投資人,但當他告訴對方DeepSeek只做深度研究和科學探索、沒有任何商業化或產品路線圖時,投資人紛紛打了退堂鼓。
最後梁文鋒自己掏錢養活了這個實驗室,一養就是三年。
這次74億美元的融資中,梁文鋒自己寫了最大的一張支票:200億人民幣(約30億美元),佔總額的五分之二。
融資完成後,DeepSeek設立了員工持股計劃,按實際估值分配股份。
梁文鋒告訴身邊人,他的戰略不會變:繼續開源、保持低價、專注AGI。他把AGI定義為機器在理解、推理、學習、規劃和適應等廣泛任務上達到人類水平。
他還告訴身邊人,AI不應該被少數人控制。
DeepSeek是目前唯一一家將所有模型底層代碼完全公開的主要AI實驗室。
在美國開發者群體中,DeepSeek的存在感正在急速膨脹。今年4月發布的旗艦模型V4,5月在Vercel的AI Gateway平台上token用量份額從不到1%飆升至17%,一個月內成為該平台僅次於Anthropic和Google的第三大模型。
輕量版V4 Flash的價格比Anthropic模型便宜20到50倍。
這種增長在6月仍在繼續。
本文來源:量子位
風險提示及免責條款
市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。
222.56萬 熱度
850.41萬 熱度
47.48萬 熱度
2201.05萬 熱度
101.41萬 熱度
Claude Mythos讓梁文鋒決定融資
什麼是DeepSeek開啟融資的直接導火索?
The Information最新消息曝光:梁文鋒看到Claude Mythos透過海量算力和數據訓練出超強能力,意識到DeepSeek不儲備彈藥根本沒法打下去了。
Anthropic今年4月發布第一個預覽,DeepSeek融資傳聞也是4月中旬第一次傳出。
時間線,剛好對得上。
DeepSeek三百人團隊要翻倍
融資完成後,DeepSeek本週四罕見地發了一則公開聲明:
所有部門招人「至少翻倍」,覆蓋AI系統開發、基礎設施、產品開發和深度學習研究。
目前DeepSeek全公司約300人。
其中負責把模型轉化為自主AI智能體的核心部門 Harness團隊,已經進入每天面試的狀態。
該團隊負責人崔天一今年3月從Jane Street跳槽加入,本月早些時候在X上透露了這一節奏。
與此同時,DeepSeek正在加緊適配國產晶片,梁文鋒相信華為晶片幾年內就能追上輝達的水平,DeepSeek應該率先完成適配。
華為去年才得知DeepSeek在私下試驗自家晶片後,開始與其直接合作。
但適配的代價不小。
DeepSeek的訓練和部署系統是圍繞輝達CUDA軟體搭建的,工程師必須重寫底層軟體才能讓模型在華為晶片上高效運行。
這直接導致DeepSeek長達15個月沒有發布任何新一代模型,在其他頂級實驗室兩三個月就發一次新模型的時代,這個空窗期格外扎眼。
這也讓DeepSeek錯過了去年下半年Anthropic Claude Code掀起的編程工具熱潮。
但梁文鋒在路演中對投資人說,編程工具和AI聊天機器人一樣,都只是AI進化中的臨時產物,如果重注押在這些短期產品上,會偏離通往AGI的終極目標。
「AI不應該被少數人控制」
2023年他確實見過投資人,但當他告訴對方DeepSeek只做深度研究和科學探索、沒有任何商業化或產品路線圖時,投資人紛紛打了退堂鼓。
最後梁文鋒自己掏錢養活了這個實驗室,一養就是三年。
這次74億美元的融資中,梁文鋒自己寫了最大的一張支票:200億人民幣(約30億美元),佔總額的五分之二。
融資完成後,DeepSeek設立了員工持股計劃,按實際估值分配股份。
梁文鋒告訴身邊人,他的戰略不會變:繼續開源、保持低價、專注AGI。他把AGI定義為機器在理解、推理、學習、規劃和適應等廣泛任務上達到人類水平。
他還告訴身邊人,AI不應該被少數人控制。
DeepSeek是目前唯一一家將所有模型底層代碼完全公開的主要AI實驗室。
在美國開發者群體中,DeepSeek的存在感正在急速膨脹。今年4月發布的旗艦模型V4,5月在Vercel的AI Gateway平台上token用量份額從不到1%飆升至17%,一個月內成為該平台僅次於Anthropic和Google的第三大模型。
輕量版V4 Flash的價格比Anthropic模型便宜20到50倍。
這種增長在6月仍在繼續。
本文來源:量子位
風險提示及免責條款