#Deepseek Goes Viral#


中国の杭州に拠点を置くAIスタートアップDeepSeekは、2024年12月下旬に大型言語モデルDeepSeek-V3を発表し、グローバルなAI業界で注目を集めました。このモデルは6710億のパラメータを持っていますが、他の主要なテクノロジー企業に比べて訓練にかかる時間は約2ヶ月で、コストは558万ドルと著しく低いです。
DeepSeek-V3はオープンソースモデルの中で最高のパフォーマンスを発揮し、世界最先端のモデルと比較しています。同社は訓練プロセスを最適化し、AIトレーニングに必要な先進の半導体へのアクセス制限にもかかわらず、約278万時間のNvidiaのH800 GPUを使用してコストを最小限に抑えました。これにより、中国のAI企業が重要な進展を遂げたことが示されています。
DeepSeekの成功は、Nvidiaなどのテクノロジー企業の株価が急落し、米国のテクノロジー産業に懸念を引き起こしました。専門家は、DeepSeekがオープンソース技術と効果的なトレーニング方法の利用により、米国の競合他社よりもはるかに低コストで高いパフォーマンスを達成したと信じています。
DeepSeekは、モデルのソースコードと詳細な技術的説明を公開し、世界中の研究者や開発者がこの技術にアクセスして改善できるようにしています。この透明性は、米国の主要AI企業のより秘密主義的なアプローチと対照的であり、将来、大手テクノロジー企業がモデルを開発する方法を変える可能性があります。
MAJOR10.22%
S2.28%
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
0/400
コメントなし
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)