DeepSeekが資金調達を開始する直接の引き金は何だったのか?
The Informationの最新情報が明らかにしたところによると、梁文鋒氏はClaude Mythosが膨大な計算リソースとデータを使って超強力な能力を訓練しているのを目にし、DeepSeekが弾薬を蓄えなければ到底戦えないと悟った。
Anthropicが今年4月に最初のプレビューを公開し、DeepSeekの資金調達の噂も4月中旬に初めて流れた。
タイムラインは、ちょうど一致している。
資金調達完了後、DeepSeekは今週木曜日に珍しく公開声明を発表した:
全部門で「少なくとも倍増」の採用を行い、AIシステム開発、インフラ、プロダクト開発、深層学習研究をカバーする。
現在、DeepSeekの全社員は約300人。
その中で、モデルを自律型AIエージェントに変換する中核部門であるHarnessチームは、すでに毎日面接を行う状態に入っている。
同チームの責任者である崔天氏は今年3月にJane Streetから転職して加入し、今月初めにXでこのペースを明かした。
同時に、DeepSeekは国産チップへの適応を加速しており、梁文鋒氏は華為のチップが数年以内にNVIDIAの水準に追いつくと信じており、DeepSeekが率先して適応を完了すべきだと考えている。
華為は昨年になって初めて、DeepSeekが自社のチップを非公開で試験していることを知り、直接協力を開始した。
しかし、適応には大きな代償が伴う。
DeepSeekの訓練とデプロイメントシステムはNVIDIAのCUDAソフトウェアを中心に構築されており、エンジニアはモデルを華為のチップ上で効率的に動作させるために、基盤ソフトウェアを書き直さなければならない。
このため、DeepSeekは15ヶ月にわたって新世代モデルを一切リリースできず、他のトップラボが2〜3ヶ月ごとに新モデルを発表する時代にあって、この空白期間は特に顕著だった。
また、このためDeepSeekは昨年後半にAnthropicのClaude Codeが引き起こしたプログラミングツールのブームに乗り遅れた。
しかし、梁文鋒氏はロードショーで投資家に対し、プログラミングツールもAIチャットボットも、AIの進化における一時的な産物に過ぎず、これらの短期的な製品に重きを置けば、AGIへの究極の目標から逸れると語った。
2023年に彼は実際に投資家と面会したが、DeepSeekが深層研究と科学的探求のみを行い、商業化やプロダクトロードマップは一切ないと伝えたところ、投資家たちは尻込みした。
最終的に、梁文鋒氏は自ら資金を出してこの研究所を支え、3年間それを続けた。
今回の74億ドルの資金調達において、梁文鋒氏自身が最大の小切手を書いた:200億人民元(約30億ドル)で、総額の5分の2に相当する。
資金調達完了後、DeepSeekは従業員持株制度を設立し、実際の評価額に応じて株式を割り当てた。
梁文鋒氏は周囲に、自身の戦略は変わらないと語った:引き続きオープンソースを維持し、低価格を保ち、AGIに集中する。彼はAGIを、理解、推論、学習、計画、適応など幅広いタスクにおいて機械が人間レベルに達することと定義している。
また、彼は周囲に、AIは少数の人々に支配されるべきではないと語った。
DeepSeekは現在、すべてのモデルの基盤コードを完全に公開している唯一の主要AIラボである。
米国の開発者コミュニティにおいて、DeepSeekの存在感は急速に拡大している。今年4月にリリースされたフラッグシップモデルV4は、5月にVercelのAI Gatewayプラットフォーム上でトークン使用量シェアが1%未満から17%に急上昇し、1ヶ月でAnthropicとGoogleに次ぐ第3位のモデルとなった。
軽量版V4 Flashの価格はAnthropicモデルより20〜50倍安い。
この成長は6月も続いている。
本文出自:量子位
リスク警告および免責条項
市場にはリスクがあり、投資には注意が必要です。本記事は個人投資のアドバイスを構成するものではなく、個々のユーザーの特別な投資目標、財務状況、またはニーズを考慮したものでもありません。ユーザーは本記事の意見、見解、または結論が自身の特定の状況に適合するかどうかを考慮すべきです。これに基づく投資は、自己責任で行ってください。
2.21M 人気度
8.5M 人気度
66.32K 人気度
528.73K 人気度
22.01M 人気度
Claude Mythosが梁文鋒に融資を決断させた。
DeepSeekが資金調達を開始する直接の引き金は何だったのか?
The Informationの最新情報が明らかにしたところによると、梁文鋒氏はClaude Mythosが膨大な計算リソースとデータを使って超強力な能力を訓練しているのを目にし、DeepSeekが弾薬を蓄えなければ到底戦えないと悟った。
Anthropicが今年4月に最初のプレビューを公開し、DeepSeekの資金調達の噂も4月中旬に初めて流れた。
タイムラインは、ちょうど一致している。
DeepSeekの300人チームは倍増へ
資金調達完了後、DeepSeekは今週木曜日に珍しく公開声明を発表した:
全部門で「少なくとも倍増」の採用を行い、AIシステム開発、インフラ、プロダクト開発、深層学習研究をカバーする。
現在、DeepSeekの全社員は約300人。
その中で、モデルを自律型AIエージェントに変換する中核部門であるHarnessチームは、すでに毎日面接を行う状態に入っている。
同チームの責任者である崔天氏は今年3月にJane Streetから転職して加入し、今月初めにXでこのペースを明かした。
同時に、DeepSeekは国産チップへの適応を加速しており、梁文鋒氏は華為のチップが数年以内にNVIDIAの水準に追いつくと信じており、DeepSeekが率先して適応を完了すべきだと考えている。
華為は昨年になって初めて、DeepSeekが自社のチップを非公開で試験していることを知り、直接協力を開始した。
しかし、適応には大きな代償が伴う。
DeepSeekの訓練とデプロイメントシステムはNVIDIAのCUDAソフトウェアを中心に構築されており、エンジニアはモデルを華為のチップ上で効率的に動作させるために、基盤ソフトウェアを書き直さなければならない。
このため、DeepSeekは15ヶ月にわたって新世代モデルを一切リリースできず、他のトップラボが2〜3ヶ月ごとに新モデルを発表する時代にあって、この空白期間は特に顕著だった。
また、このためDeepSeekは昨年後半にAnthropicのClaude Codeが引き起こしたプログラミングツールのブームに乗り遅れた。
しかし、梁文鋒氏はロードショーで投資家に対し、プログラミングツールもAIチャットボットも、AIの進化における一時的な産物に過ぎず、これらの短期的な製品に重きを置けば、AGIへの究極の目標から逸れると語った。
「AIは少数の人々に支配されるべきではない」
2023年に彼は実際に投資家と面会したが、DeepSeekが深層研究と科学的探求のみを行い、商業化やプロダクトロードマップは一切ないと伝えたところ、投資家たちは尻込みした。
最終的に、梁文鋒氏は自ら資金を出してこの研究所を支え、3年間それを続けた。
今回の74億ドルの資金調達において、梁文鋒氏自身が最大の小切手を書いた:200億人民元(約30億ドル)で、総額の5分の2に相当する。
資金調達完了後、DeepSeekは従業員持株制度を設立し、実際の評価額に応じて株式を割り当てた。
梁文鋒氏は周囲に、自身の戦略は変わらないと語った:引き続きオープンソースを維持し、低価格を保ち、AGIに集中する。彼はAGIを、理解、推論、学習、計画、適応など幅広いタスクにおいて機械が人間レベルに達することと定義している。
また、彼は周囲に、AIは少数の人々に支配されるべきではないと語った。
DeepSeekは現在、すべてのモデルの基盤コードを完全に公開している唯一の主要AIラボである。
米国の開発者コミュニティにおいて、DeepSeekの存在感は急速に拡大している。今年4月にリリースされたフラッグシップモデルV4は、5月にVercelのAI Gatewayプラットフォーム上でトークン使用量シェアが1%未満から17%に急上昇し、1ヶ月でAnthropicとGoogleに次ぐ第3位のモデルとなった。
軽量版V4 Flashの価格はAnthropicモデルより20〜50倍安い。
この成長は6月も続いている。
本文出自:量子位
リスク警告および免責条項