📰 【最強オープンソースモデルDeepSeek v4ついに登場!1.6兆パラメータモデル、MITライセンス、長文のGPUメモリをV3.2の十分の一に圧縮】


動察Beatingの監視によると、DeepSeekオープンソースV4シリーズのプレビュー版は、MITライセンスを採用し、重みはHugging FaceとModelScopeに公開済み。このシリーズには2つのMoEモデルが含まれる:V4-Proは総パラメータ1.6T、1トークンあたりの活性化は49B(490億);V4-Flashは総パラメータ284B(2840億)、活性化は13B(130億)。両モデルともに1Mトークンのコンテキストをサポート。アーキテクチャには3つのアップグレード:混合アテンションメカニズム(圧縮疎結合アテンションCSA + 重度圧縮アテンションHCA)が長いコンテキストのコストを大幅に削減し、1Mのコンテキスト下でV4...
兄弟たち、DeepSeekがまたやらかした!1.6兆パラメータのV4モデルをMITライセンスで直接オープンソース化し、長文のGPUメモリもV3.2の十分の一に圧縮。これこそ本当の技術革命だ、空気コインを煽るゴミプロジェクトとは比べ物にならない。
$FET $AGIX これらのAIコンセプトコイン、今回は追風に乗って一波飛ばせるか?古参のファンはみんな知ってる、ソロ哥が一番嫌うのは大きな夢を描くことだけど、実際の技術突破は、乗るべきときに果断に行くべきだ。機関投資家が仕掛けるのを待たずに、あなたはまだ呆然としているのか。👇👇👇👇👇
FET0.38%
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン