**Sui Finance Yan Minghui **近日、中信証券のリサーチノートは、AIが「単純な対話」から「エージェント(Agent)」へ進化しており、それがコンテキスト長の急増を牽引していると述べた。Epoch AIのデータによれば、最長のコンテキストウィンドウは約毎年30倍のペースで拡大しており、KV CacheのGPUメモリ容量とコンテキスト長は線形の関係にある。これは、ハードウェアの構成改善スピードを大きく上回っている。現時点で大規模モデルのベンダーやハードウェアベンダーは、主に量子化、階層型ストレージ、モデルアーキテクチャ最適化によって計算・メモリ能力(ストレージ力)のボトルネックを解消しようとしているが、それでもなおGPUメモリ需要の爆発を変えることはできていない。中信証券は、GPUメモリ最適化によって1トークンあたりの生成コストを下げられる可能性があり、結果としてユーザーがより高い同時実行数とより長いコンテキストを開始することを促すだろうと考えている。総ストレージ需要は減らず、むしろ増える見通しで、ストレージのアップグレードは現在のAgent推論の中核的な需要になっていく。ストレージの成長トレンドを強く見込んでいる。関連企業:中信証券sh600030
中信证券:総預金需要は減少せずむしろ増加傾向、ストレージの成長トレンドを強く見込む
**Sui Finance Yan Minghui **近日、中信証券のリサーチノートは、AIが「単純な対話」から「エージェント(Agent)」へ進化しており、それがコンテキスト長の急増を牽引していると述べた。
Epoch AIのデータによれば、最長のコンテキストウィンドウは約毎年30倍のペースで拡大しており、KV CacheのGPUメモリ容量とコンテキスト長は線形の関係にある。これは、ハードウェアの構成改善スピードを大きく上回っている。現時点で大規模モデルのベンダーやハードウェアベンダーは、主に量子化、階層型ストレージ、モデルアーキテクチャ最適化によって計算・メモリ能力(ストレージ力)のボトルネックを解消しようとしているが、それでもなおGPUメモリ需要の爆発を変えることはできていない。
中信証券は、GPUメモリ最適化によって1トークンあたりの生成コストを下げられる可能性があり、結果としてユーザーがより高い同時実行数とより長いコンテキストを開始することを促すだろうと考えている。総ストレージ需要は減らず、むしろ増える見通しで、ストレージのアップグレードは現在のAgent推論の中核的な需要になっていく。ストレージの成長トレンドを強く見込んでいる。
関連企業:中信証券sh600030