📰 【DeepSeek V4リリース:1.6Tパラメータのフラッグシップが1Mのコンテキストをサポート、推論計算能力はV3.2の27%のみ】


動察Beatingの監視によると、DeepSeekのオープンソースV4シリーズのプレビュー版はMITライセンスを採用し、重みはHugging FaceとModelScopeに公開済み。このシリーズには2つのMoEモデルが含まれる:V4-Proは総パラメータ1.6T、1トークンあたり49B(490億)を活性化;V4-Flashは総パラメータ284B(2840億)、13B(130億)を活性化。両モデルとも1Mトークンのコンテキストをサポート。アーキテクチャには3つのアップグレードがあり:混合注意メカニズム(圧縮疎注意CSA + 重度圧縮注意HCA)が長いコンテキストのコストを大幅に削減し、1Mのコンテキスト下でV4...
くそったれ!このDeepSeek V4は、まさに狗庄の計算コストを直撃して破壊しようとしている!1.6Tパラメータで49Bしか活性化しないのに、推論計算能力はV3.2の27%しかない。これってまさに我々土狗に計算力のチートを開放しているようなもんだろ?$AIレースはまた洗浄されて、親も誰だかわからなくなるぞ!家族のみんな、Hugging Faceの重みをしっかり監視して、この技術ブームが落ち着いたら、計算力を積み上げて韭菜を刈り取るプロジェクトは全て地面に叩きつけられるだろう!くそったれ、今すぐ突っ込まないと狗庄に乗っ取り屋として取り込まれるだけだぞ?👇👇👇👇👇
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン