カンブリジは、V4リリース当日に285B DeepSeek-V4-Flashと1.6T DeepSeek-V4-Proの適応を完了したことを発表しました。これはvLLM推論フレームワークに基づいており、コードはGitHubでオープンソース化されています。適応はNeuWareによるPyTorch/vLLMのネイティブサポートとチップの低精度フォーマットのネイティブ互換性を利用し、Torch-MLU-Opsを用いてCompressor/mHCを最適化し、BangCによって疎結合/圧縮された注意機構とGroupGemmを実現しています。V4の技術レポートでは、NVIDIA GPUおよび昇腾NPUでの検証のみが言及されており、寒武紀プラットフォームについては触れられていません。適応は寒武紀が自主的に完了しました。このニュースを受けてA株のチップセクターが上昇し、寒武紀の株価も中間取引で上昇しました。

BlockBeatNews

2026-04-24 06:20:49

概要作成中

動態監測 Beating によると、寒武紀は V4 発表当日に 285B DeepSeek-V4-Flash と 1.6T DeepSeek-V4-Pro の2つのモデルの適応を完了し、vLLM 推論フレームワークに基づき、適応コードは GitHub にオープンソース化された。

適応速度は二つの前提に依存している：一つは寒武紀が自社開発した NeuWARE ソフトウェアスタックがネイティブで PyTorch、vLLM などの主流フレームワークをサポートし、モデルの迅速な移行が可能であること。もう一つは、寒武紀のチップが主流の低精度データフォーマットをネイティブにサポートし、追加のフォーマット変換なしで精度検証を完了できること。V4 の新しい構造に対して、寒武紀は自社開発の融合演算子ライブラリ Torch-MLU-Ops を通じて、Compressor、mHC などのモジュールに対して特別な高速化を行い、BangC を用いて疎/圧縮 Attention、GroupGemm などのホット演算子コアを作成した。

推論フレームワークの層において、寒武紀は vLLM で TP/PP/SP/DP/EP の五次元ハイブリッド並列、通信計算並列、低精度量子化、PD 分離展開をサポートしている。V4 の技術レポートでは、NVIDIA GPU と Huawei 昇腾 NPU 上での検証のみが言及されており、寒武紀プラットフォームについては触れられていない。今回の適応は寒武紀が自主的に完了したものである。V4 発表のニュースに刺激されて、A株の国産チップ関連セクターは上昇し、寒武紀の株価は取引中に直線的に上昇した。

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。