2025-01-31 05:31:01

#Deepseek Goes Viral#

DeepSeek，一家位於中國杭州的人工智能初創公司，憑藉2024年12月下旬推出的大型語言模型DeepSeek-V3，在全球人工智能行業引起了廣泛關注。該模型擁有6710億個參數，但僅用了約兩個月的時間進行訓練，成本為558萬美元，遠低於其他主要技術公司的投資。
DeepSeek-V3在開源模型中取得了最佳性能，並與世界上最先進的模型進行了比較。該公司已經優化了訓練過程，以最小化成本，在中國生產的Nvidia H800 GPU上使用了約278萬小時。這表明，儘管受到美國對獲取AI訓練所需先進半導體的限制，中國的人工智能公司取得了顯著進展。
DeepSeek的成功引起了美國科技行業的擔憂，英偉達和其他科技公司的股票大幅下挫。專家認為，得益於採用開源技術和有效的培訓方法，DeepSeek以比美國同行更低的成本實現了高性能。
此外，DeepSeek已發佈了模型的源代碼和詳細的技術解釋，使全球的研究人員和開發人員能夠訪問和改進這項技術。這種透明度與美國主要人工智能公司更加神祕的方法形成鮮明對比，可能會改變未來大型科技公司開發模型的方式。

DEEPSEEK2.76%

MAJOR12.69%

S1.17%

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

讚賞
點讚
留言
轉發
分享

留言

0/400

暫無留言