広場
最新
注目
ニュース
プロフィール
ポスト
SpeedingSoloBrother
2026-04-24 03:16:43
フォロー
📰 【最強オープンソースモデル DeepSeek V4 ついに登場!1.6兆パラメータモデル、MITライセンス、長文のメモリ圧縮をV3.2の10分の1に】
動察Beatingの監視によると、DeepSeekオープンソースV4シリーズのプレビュー版はMITライセンスを採用し、重みはHugging FaceとModelScopeに公開済み。このシリーズには2つのMoEモデルが含まれる:V4-Proは総パラメータ1.6T、1トークンあたりの活性化は49B(490億);V4-Flashは総パラメータ284B(2840億)、活性化は13B(130億)。両モデルとも1Mトークンのコンテキストをサポート。アーキテクチャには3つのアップグレードがあり:混合アテンションメカニズム(圧縮疎結合アテンションCSA + 重度圧縮アテンションHCA)が長いコンテキストのコストを大幅に削減し、1Mのコンテキスト下でV4...
兄弟たち、DeepSeekはまた大きなことをやってのけた。V4オープンソースモデルは直接1.6兆パラメータ、MITライセンスで自由に使える。長文のメモリをV3.2の10分の1に圧縮。こいつは本当にやる気満々だ、大モデルをまるで白菜のようにばらまいている。個人投資家もAIを遊びたいなら早く乗るべきだ、あの時のコイン王を逃したようにこの技術の恩恵を逃すな。👇👇👇👇👇
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については
免責事項
をご覧ください。
報酬
いいね
コメント
リポスト
共有
コメント
コメントを追加
コメントを追加
コメント
コメントなし
人気の話題
もっと見る
#
WCTCTradingKingPK
162.94K 人気度
#
CryptoMarketSeesVolatility
228.2K 人気度
#
IsraelStrikesIranBTCPlunges
31.85K 人気度
#
rsETHAttackUpdate
72.33K 人気度
#
US-IranTalksStall
179.87K 人気度
ピン
サイトマップ
📰 【最強オープンソースモデル DeepSeek V4 ついに登場!1.6兆パラメータモデル、MITライセンス、長文のメモリ圧縮をV3.2の10分の1に】
動察Beatingの監視によると、DeepSeekオープンソースV4シリーズのプレビュー版はMITライセンスを採用し、重みはHugging FaceとModelScopeに公開済み。このシリーズには2つのMoEモデルが含まれる:V4-Proは総パラメータ1.6T、1トークンあたりの活性化は49B(490億);V4-Flashは総パラメータ284B(2840億)、活性化は13B(130億)。両モデルとも1Mトークンのコンテキストをサポート。アーキテクチャには3つのアップグレードがあり:混合アテンションメカニズム(圧縮疎結合アテンションCSA + 重度圧縮アテンションHCA)が長いコンテキストのコストを大幅に削減し、1Mのコンテキスト下でV4...
兄弟たち、DeepSeekはまた大きなことをやってのけた。V4オープンソースモデルは直接1.6兆パラメータ、MITライセンスで自由に使える。長文のメモリをV3.2の10分の1に圧縮。こいつは本当にやる気満々だ、大モデルをまるで白菜のようにばらまいている。個人投資家もAIを遊びたいなら早く乗るべきだ、あの時のコイン王を逃したようにこの技術の恩恵を逃すな。👇👇👇👇👇