DeepSeek V4は今後数週間以内にリリースされる予定で、Huaweiのチップ上で完全に動作する可能性があります

robot
概要作成中

BlockBeatsのメッセージ、4月4日、米国のテクノロジーメディアThe Informationの最新報道によると、中国のAIスタートアップDeepSeekが間もなく発表する新世代のフラッグシップモデルV4は、華為が自社開発した半導体チップの上で完全に稼働する予定だとされ、中国が半導体の自主化を進めるうえで重要なマイルストーンと見なされている。

V4は今後数週間のうちにリリースされる見込みで、華為のチップ上で完全に稼働する。DeepSeekはこれに向けて、華為およびチップ設計ベンダーの寒武紀と数か月間協力し、国内半導体との互換性を実現するためにモデルの基盤部分のコードを書き換えた。

注目すべき点として、DeepSeekは今回、英伟达にV4の事前テスト権を開放せず、国内の半導体企業のみを招いて初期の最適化に参加させる形を取っており、業界の慣例を破った。

アリババ、ビサイト、テンセントなどの中国のテック大手はすでに華為の最新モデルAscend 950PRチップを先行して大量に購入しており、総注文数は数十万個に達する。クラウドサービスを通じてV4を展開し、自社のAIアプリに統合する計画だ。需要の急増が当該チップの価格を約20%押し上げている。

V4は混合専門家アーキテクチャ(MoE)を採用しており、総パラメータ数は約1兆(1万億)。1回の推論で有効化されるパラメータは約370億で、低遅延を維持しながら、テキスト、画像、コードのマルチモーダル入力に対応できる。

昨年DeepSeekは低コストモデルV3とR1を発表し、世界のテック株が大きく下落するきっかけとなり、市場では「米国のAI企業は数十億ドルを投じて計算資源を調達する必要があるのか」という疑念が広がった。こうした経緯からV4は国際的にも大きな注目を集めている。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン