DeepSeek V4は今後数週間以内にリリース予定、Huaweiチップで完全運用

robot
概要作成中

4月4日付の米国のテクノロジー系メディアThe Informationの報道によると、中国のAIスタートアップDeepSeekは次世代のフラッグシップモデルV4をリリースする予定で、同モデルはHuaweiが自社開発したチップによって完全に運用される。これは、中国が半導体の自立を進めるうえで重要な節目とみなされている。V4は今後数週間でのローンチが見込まれており、Huaweiおよびチップ設計者Cambriconとの協力のもと、数か月にわたって開発された。この期間中に、国内チップとの互換性を確実にするため、モデルの基盤となるコードが書き換えられた。注目すべき点として、DeepSeekはV4についてNvidiaに早期のテストアクセスを許可していない。代わりに国内のチップ企業を早期最適化への参加として招いており、業界の慣行を破っている。Alibaba、ByteDance、Tencentといった中国の大手テック企業はすでに、Huaweiの最新Ascend 950PRチップを数十万個に相当する規模で大量に発注しており、クラウドサービスを通じてV4を展開し、自社のAIアプリケーションに統合する意図だ。需要の急増により、チップの価格はおよそ20%引き上げられた。V4は、総パラメータ数が約1兆の混合専門家(MoE)アーキテクチャを採用し、推論ごとに約370億パラメータを有効化する。テキスト、画像、コードのマルチモーダル入力に対応しつつ、低レイテンシーを維持する。昨年、DeepSeekが低コストのモデルV3およびR1をリリースしたことは、世界のテック株に大きな下落をもたらし、米国のAI企業が計算能力に数十億ドルを費やす必要があるのかという疑問を呼んだ。結果として、V4は大きな国際的注目を集めている。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン