DeepSeek V4が米国の二つの派閥の議論を引き起こす:シンクタンクは禁じられたチップに頼ることで半年遅れと指摘、シリコンバレーのCEOはオープンイノベーションだと主張

robot
概要作成中

据动察 Beating 监测,美国外交关系委员会(CFR)中国与新兴技术高级研究员 Chris McGuire(前白宫国安会、国防部成员)发文称 V4 未改变中美 AI 竞争格局。
彼は、V4レポートの原文を引用し、DeepSeekは推論能力が「最先端モデルより約3〜6ヶ月遅れている」と認めており、対象は半年前にリリースされたGPT-5.2とGemini 3.0 Proであると述べている。
彼はまた、V4レポートがNVIDIA GPUと華為昇腾NPUに推論端の適応を明らかにしている一方で、訓練に使用された具体的なGPUモデルやコストについては公開していないことを疑問視している(V3はH800を2000枚使用し、コストは557万ドルと主張していた)。
沈黙は、輸出規制対象のNVIDIA Blackwellチップを使用していることを示唆していると考えている。
以前、米国政府関係者が2月に匿名で同様の見解を示したことがあり、NVIDIAはこれを「無理筋」と否定した。
DeepSeekはBlackwellの使用を否定し、モデルはNVIDIA H800と華為昇腾910C上で訓練されたと述べている。

ReplitのCEO Amjad Masadはこれに対抗し、米国の政治家やロビイストが「中国の蒸留」恐慌を扇動している一方で、中国の科学者たちは真のAIブレークスルーを公開して共有していると述べた。
彼はDeepSeekの公式ツイートに記載された構造的革新、例えばトークンレベルの注意圧縮(DeepSeek Sparse Attention)や長いコンテキスト計算効率の大幅な向上を引用し、V4-Proの1Mコンテキスト時の1トークン推論計算能力とKVキャッシュの占有量がV3.2よりもはるかに低いことを指摘した。
Masadは、この種のアーキテクチャレベルの革新は訓練データの蒸留とは全く関係なく、誰もがオープンソースから恩恵を受けられると考えている。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン