寒武紀がDeepSeek-V4への適応を完了、コードをオープンソース化し、国産チップ株を押し上げる

robot
概要作成中
ME News 消息,4月24日(UTC+8)、動察 Beatingのモニタリングによると、寒武紀はV4リリース当日に285B DeepSeek-V4-Flashと1.6T DeepSeek-V4-Proの2モデルの適応を完了したと発表した。vLLM推論フレームワークに基づき、適応コードはGitHubでオープンソース化された。適応速度は2つの前提に依存する:1つは寒武紀が自社開発したNeuWareソフトウェアスタックがPyTorch、vLLMなどの主要フレームワークをネイティブサポートしており、モデルを迅速に移行できること、もう1つは寒武紀のチップが主要な低精度データ形式をネイティブサポートしており、追加の形式変換なしで精度検証を完了できることである。V4の新構造に対し、寒武紀は自社開発の融合演算子ライブラリTorch-MLU-Opsを用いてCompressor、mHCなどのモジュールに特化した高速化を施し、BangCでスパース/圧縮Attention、GroupGemmなどのホットスポット演算子カーネルを記述した。推論フレームワークレベルでは、寒武紀はvLLMにおいてTP/PP/SP/DP/EPの5次元ハイブリッド並列、通信計算並列、低精度量子化、PD分離デプロイをサポートしている。V4技術レポートではNVIDIA GPUと華為昇騰NPUでの検証のみ言及され、寒武紀プラットフォームは含まれていなかったが、今回の適応は寒武紀が独自に完了したものである。V4リリースのニュースに刺激され、A株の国産半導体セクターが上昇し、寒武紀の株価は取引時間中に急騰した。(出典:BlockBeats)
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン留め