毎日経済ニュースAI速報。中信証券のリサーチレポートによると、AIは「単純な対話」から「エージェント(Agent)」へと進化し、コンテキスト長が急増を引き起こしている。Epoch AIのデータによれば、最長のコンテキストウィンドウは年あたり約30倍のペースで拡大しており、KV CacheのVRAM(顯存)容量とコンテキスト長には線形の成長関係がある。ハードウェア構成の増速を大幅に上回っている。現在、大規模モデルのメーカーやハードウェア企業は、主に量子化、階層型ストレージ、モデルアーキテクチャ最適化の方式で計算資源のボトルネックを解消しようとしているが、それでもなおVRAM需要の爆発は変えられていない。中信証券は、VRAMの最適化によって1トークン生成あたりのコストを引き下げることができ、結果としてユーザーがより高い同時並行とより長いコンテキストを開始することを促し、総計算資源(存力)需要は減るどころかむしろ増えるとみている。計算資源のアップグレードは、現在のエージェントの推論における中核的な需要へと位置づけられ、ストレージ成長トレンドを強く見込んでいる。毎日経済新聞 (編集者:董萍萍 ) 【免責事項】本記事は著者個人の見解のみを表し、和訊とは関係ありません。和訊のウェブサイトは、本文中の陳述、見解判断について中立の立場を取り、ここに含まれる内容の正確性、信頼性、完全性について、明示または黙示を問わずいかなる保証も提供しません。読者の皆さまは参考としてのみご利用いただき、また、すべての責任は各自で負ってください。メール:news_center@staff.hexun.com 通報
中信証券:ストレングスの強化は、現在のインテリジェントエージェント推論の核心的な要求です
毎日経済ニュースAI速報。中信証券のリサーチレポートによると、AIは「単純な対話」から「エージェント(Agent)」へと進化し、コンテキスト長が急増を引き起こしている。Epoch AIのデータによれば、最長のコンテキストウィンドウは年あたり約30倍のペースで拡大しており、KV CacheのVRAM(顯存)容量とコンテキスト長には線形の成長関係がある。ハードウェア構成の増速を大幅に上回っている。現在、大規模モデルのメーカーやハードウェア企業は、主に量子化、階層型ストレージ、モデルアーキテクチャ最適化の方式で計算資源のボトルネックを解消しようとしているが、それでもなおVRAM需要の爆発は変えられていない。中信証券は、VRAMの最適化によって1トークン生成あたりのコストを引き下げることができ、結果としてユーザーがより高い同時並行とより長いコンテキストを開始することを促し、総計算資源(存力)需要は減るどころかむしろ増えるとみている。計算資源のアップグレードは、現在のエージェントの推論における中核的な需要へと位置づけられ、ストレージ成長トレンドを強く見込んでいる。
毎日経済新聞
(編集者:董萍萍 )
通報