広場
最新
注目
ニュース
プロフィール
ポスト
小米MiMo初公開モデル推論システム全リンク最適化技術の詳細
MarsBitNews
2026-05-30 13:16:57
フォロー
概要作成中
火星财经消息 5月30日消息,小米正式公开MiMo-V2.5系列模型的推理系统全链路优化方案。
チームはハイブリッドSWA + MoE + マルチモーダルの複合アーキテクチャを中心に、
システム的にKVCache管理、階層キャッシュ、プレフィル/デコードの完全な推論スタックを再構築し、
KVCacheのストレージ圧縮を同等の方案の約1/7に抑え、長いシーケンスのシナリオで推論コストを大幅に削減——
これは今回の価格引き下げの核心技術基盤です。
5月27日、MiMo-V2.5シリーズAPIは永久的な値下げを完了し、最大99%の割引を実現し、入力長さを区別しません。(広角観察)
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については
免責事項
をご覧ください。
9 いいね
報酬
9
9
1
共有
コメント
コメントを追加
コメントを追加
コメント
GasFeesForNightRuns
· 6時間前
小米のこの推理コストは足首まで削り落とした、99%の削減は本気ですか
原文表示
返信
0
QueuePosition
· 6時間前
チップからフレームワーク、APIの価格設定まで全てのチェーンをつなぐ、小米のこの戦略は、かつてのスマートフォン市場におけるコストパフォーマンス路線に非常に似ている
原文表示
返信
0
PerpColdHands
· 7時間前
実測を待つ、1/7のKVCache圧縮比が本当なら、メモリボトルネックは緩和されるだろう
原文表示
返信
0
TheRedTelephoneBoothInTheRuins
· 7時間前
MoEアーキテクチャ+SWAアテンション、この構成はオープンソース界でもトップクラスといえるものであり、シャオミの今回の技術公開はかなり明快です
原文表示
返信
0
BlueLakeOverlooker
· 7時間前
推理コスト構造が変わったため、下流アプリケーションの価格の基準点も再評価する必要があり、全体のエコシステムが再編成される可能性がある。
原文表示
返信
0
ResilientGoldfish
· 7時間前
長さを区別しない点が非常に強力で、長い文章のユーザーは大喜び、もうトークンを細かく計算する必要はなくなる。
原文表示
返信
0
GlassDomeUniverse
· 7時間前
プリフィル/デコードの両方のパスが変更されており、階層キャッシュ+プレフィックスキャッシュの設計は非常に詳細で、実際のビジネスで磨き上げられたもののようだ
原文表示
返信
0
SecondaryMarketDeserter
· 7時間前
Xiaomiは大規模モデルの推論を格安にしようとしているのか?APIの価格を99%引き下げて、他社はどうやって対抗するのか?
原文表示
返信
0
Semi-MeltedIceCream
· 7時間前
5月27日永久値下げ、入力長さに関係なく——この価格設定戦略は、トークン課金の旧方式を一気に覆した
原文表示
返信
0
もっと見る
人気の話題
もっと見る
#
WinGoldBarsWithGrowthPoints
1.22M 人気度
#
WTICrudeFallsBelow90Dollars
1.18M 人気度
#
IsraelStrikesIranBTCPlunges
51.3K 人気度
#
StockTradingChallengeUpTo17000U
187.6K 人気度
#
USIranNegotiationGame
9.41M 人気度
ピン留め
サイトマップ
小米MiMo初公開モデル推論システム全リンク最適化技術の詳細
チームはハイブリッドSWA + MoE + マルチモーダルの複合アーキテクチャを中心に、
システム的にKVCache管理、階層キャッシュ、プレフィル/デコードの完全な推論スタックを再構築し、
KVCacheのストレージ圧縮を同等の方案の約1/7に抑え、長いシーケンスのシナリオで推論コストを大幅に削減——
これは今回の価格引き下げの核心技術基盤です。
5月27日、MiMo-V2.5シリーズAPIは永久的な値下げを完了し、最大99%の割引を実現し、入力長さを区別しません。(広角観察)