中国の人工知能企業が主要なチャットボットに画像と動画認識を追加同時に、地元のチップメーカーはかつてアメリカの強みだった高速起動サポートに追いついたことを示した。杭州に拠点を置くDeepSeekは、静かに「画像認識モード」と呼ばれる新機能をチャットプラットフォームに追加した。この新しいモードは、今月初めに同社が立ち上げた「エキスパート」および「フラッシュ」の2つのモードに加わる。新機能により、チャットボットはテキストだけでなく写真や動画も理解できるようになる。これにより、すでに同様の能力を長い間提供している他の主要なAIチャットボットと同等になった。DeepSeekのマルチモーダルチームの責任者、陳小康は、このツールはまずウェブサイトとモバイルアプリの少数のユーザーでテストされたと述べた。同社の上級研究員、陳德利は、会社のロゴに言及した短い投稿でこのリリースを祝った:「小さなクジラも今や見える。」画像と動画の機能は、DeepSeekが最新のフラッグシップモデル、DeepSeek-V4のプレビューをリリースし、モデルの重みを誰でもダウンロードして使用できる状態にした数日後に登場した。V4は一つのモデルではなく、二つある。最初のDeepSeek-V4-Proは1.6兆パラメータを持ち、複雑な推論や多段階の自動化ワークフローを必要とする難しいタスク向けに設計されている。二つ目のDeepSeek-V4-Flashは、多数のリクエストを低コストで処理できるように構築された。両モデルともに、100万トークンのコンテキストウィンドウをサポートしている。また、推論時の計算能力とメモリを削減すると同社が言うハイブリッドアテンション設計も採用している。中国のチップメーカーが新たなマイルストーンを達成多くの業界観測者の注目を集めたのは、モデルそのものだけでなく、そのリリース当日に何が起こったかだった。華為のAscend、Cambricon、Hygon Information、Moore Threadsの4つの中国チップ企業は、V4がリリースされたその日からハードウェアが完璧に動作したことを確認した。新モデルがリリースされてすぐに、NVIDIAのエコシステム外でもスムーズに動作するサポートは、以前はほぼ不可能だった。華為のAscendチップ、A2、A3、950を含む、はV4-ProとV4-Flashの両方をサポートしている。同社は、Ascend 950チップが融合計算処理と並列処理ストリームを使用して推論を高速化していると述べた。Cambriconは、オープンソースのvLLM推論フレームワークを用いて適応を完了し、そのコードをGitHubで共有した。Hygonは、モデルリリースから実際の使用までのスムーズな道筋を作るために、DCUプラットフォーム上で深層モデルの最適化を行った。Moore Threadsは、北京人工知能研究所と協力し、FlagOSソフトウェアスタックを使用してV4をMTS S5000カード上で動作させた。業界の観測者は、この協調的なリリースは本当の変化を示していると述べている。何年も前から、Nvidiaのエコシステム外で作られたチップは主要な新モデルをサポートするのに何ヶ月もかかっていた。8つの国内チップセットをリリース当日に動作させることは、重要なマイルストーンだ。大局:コストと独立性の向上観測者は、このリリースのより大きな意味は、DeepSeekが西側のハードウェアに頼らずに高レベルのAIを提供できることを示した点にあると考えている。複数の中国製チップ上でネイティブに動作させることで、最も強力なアメリカのプロセッサへのアクセスを妨げてきた輸出制限のリスクを低減している。コストも重要だ。DeepSeekは、モデルの運用コストを低く抑える努力を重ねてきた。これにより、企業は非常に高い計算コストを負うことなく自動化システムを構築しやすくなる。このように、DeepSeekのアップグレードとリリースは、主に技術的なブレークスルーというよりも、サプライチェーン全体の連携の結果である。このリリースから、AIのリーダーシップは、最も賢いモデルを作ることから、長期的に安価で独立してシステム全体を維持できる能力へと移行しつつある。もしこれを読んでいるなら、あなたはすでに先を行っている。私たちのニュースレターでそのまま先に進もう。
DeepSeekは、そのメインチャットボットに画像と動画の認識機能を追加します
中国の人工知能企業が主要なチャットボットに画像と動画認識を追加
同時に、地元のチップメーカーはかつてアメリカの強みだった高速起動サポートに追いついたことを示した。
杭州に拠点を置くDeepSeekは、静かに「画像認識モード」と呼ばれる新機能をチャットプラットフォームに追加した。この新しいモードは、今月初めに同社が立ち上げた「エキスパート」および「フラッシュ」の2つのモードに加わる。
新機能により、チャットボットはテキストだけでなく写真や動画も理解できるようになる。
これにより、すでに同様の能力を長い間提供している他の主要なAIチャットボットと同等になった。
DeepSeekのマルチモーダルチームの責任者、陳小康は、このツールはまずウェブサイトとモバイルアプリの少数のユーザーでテストされたと述べた。
同社の上級研究員、陳德利は、会社のロゴに言及した短い投稿でこのリリースを祝った:「小さなクジラも今や見える。」
画像と動画の機能は、DeepSeekが最新のフラッグシップモデル、DeepSeek-V4のプレビューをリリースし、モデルの重みを誰でもダウンロードして使用できる状態にした数日後に登場した。
V4は一つのモデルではなく、二つある。最初のDeepSeek-V4-Proは1.6兆パラメータを持ち、複雑な推論や多段階の自動化ワークフローを必要とする難しいタスク向けに設計されている。
二つ目のDeepSeek-V4-Flashは、多数のリクエストを低コストで処理できるように構築された。両モデルともに、100万トークンのコンテキストウィンドウをサポートしている。
また、推論時の計算能力とメモリを削減すると同社が言うハイブリッドアテンション設計も採用している。
中国のチップメーカーが新たなマイルストーンを達成
多くの業界観測者の注目を集めたのは、モデルそのものだけでなく、そのリリース当日に何が起こったかだった。
華為のAscend、Cambricon、Hygon Information、Moore Threadsの4つの中国チップ企業は、V4がリリースされたその日からハードウェアが完璧に動作したことを確認した。
新モデルがリリースされてすぐに、NVIDIAのエコシステム外でもスムーズに動作するサポートは、以前はほぼ不可能だった。
華為のAscendチップ、A2、A3、950を含む、はV4-ProとV4-Flashの両方をサポートしている。
同社は、Ascend 950チップが融合計算処理と並列処理ストリームを使用して推論を高速化していると述べた。
Cambriconは、オープンソースのvLLM推論フレームワークを用いて適応を完了し、そのコードをGitHubで共有した。
Hygonは、モデルリリースから実際の使用までのスムーズな道筋を作るために、DCUプラットフォーム上で深層モデルの最適化を行った。
Moore Threadsは、北京人工知能研究所と協力し、FlagOSソフトウェアスタックを使用してV4をMTS S5000カード上で動作させた。
業界の観測者は、この協調的なリリースは本当の変化を示していると述べている。
何年も前から、Nvidiaのエコシステム外で作られたチップは主要な新モデルをサポートするのに何ヶ月もかかっていた。8つの国内チップセットをリリース当日に動作させることは、重要なマイルストーンだ。
大局:コストと独立性の向上
観測者は、このリリースのより大きな意味は、DeepSeekが西側のハードウェアに頼らずに高レベルのAIを提供できることを示した点にあると考えている。
複数の中国製チップ上でネイティブに動作させることで、最も強力なアメリカのプロセッサへのアクセスを妨げてきた輸出制限のリスクを低減している。
コストも重要だ。DeepSeekは、モデルの運用コストを低く抑える努力を重ねてきた。これにより、企業は非常に高い計算コストを負うことなく自動化システムを構築しやすくなる。
このように、DeepSeekのアップグレードとリリースは、主に技術的なブレークスルーというよりも、サプライチェーン全体の連携の結果である。
このリリースから、AIのリーダーシップは、最も賢いモデルを作ることから、長期的に安価で独立してシステム全体を維持できる能力へと移行しつつある。
もしこれを読んでいるなら、あなたはすでに先を行っている。私たちのニュースレターでそのまま先に進もう。