#Deepseek Goes Viral#


DeepSeek,一家位於中國杭州的人工智能初創公司,憑藉2024年12月下旬推出的大型語言模型DeepSeek-V3,在全球人工智能行業引起了廣泛關注。該模型擁有6710億個參數,但僅用了約兩個月的時間進行訓練,成本為558萬美元,遠低於其他主要技術公司的投資。
DeepSeek-V3在開源模型中取得了最佳性能,並與世界上最先進的模型進行了比較。該公司已經優化了訓練過程,以最小化成本,在中國生產的Nvidia H800 GPU上使用了約278萬小時。這表明,儘管受到美國對獲取AI訓練所需先進半導體的限制,中國的人工智能公司取得了顯著進展。
DeepSeek的成功引起了美國科技行業的擔憂,英偉達和其他科技公司的股票大幅下挫。專家認為,得益於採用開源技術和有效的培訓方法,DeepSeek以比美國同行更低的成本實現了高性能。
此外,DeepSeek已發佈了模型的源代碼和詳細的技術解釋,使全球的研究人員和開發人員能夠訪問和改進這項技術。這種透明度與美國主要人工智能公司更加神祕的方法形成鮮明對比,可能會改變未來大型科技公司開發模型的方式。
MAJOR12.69%
S1.17%
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)