CITIC Securities: підвищення здатності зберігання стає ключовою потребою сучасних систем логіки, впевнено підтримуємо тенденцію зростання зберігання

robot
Генерація анотацій у процесі

Народні фінансові новини 31 березня — у звіті аналітиків CICC зазначено, що AI еволюціонує від «простих діалогів» до «інтелектуальних агентів (Agent)», що спричиняє різке зростання довжини контексту. За даними Epoch AI, найдовше вікно контексту збільшується приблизно на 30 разів щороку; зв’язок між обсягом відеопам’яті KV Cache та довжиною контексту має лінійну залежність, що значно випереджає темпи зростання швидкості апаратного забезпечення. Наразі виробники великих мовних моделей і компанії з апаратного забезпечення здебільшого вирішують вузьке місце зі зберіганням за допомогою квантизації, ієрархічного зберігання та оптимізації архітектури моделі, але це все одно не змінює того, що попит на відеопам’ять вибухатиме. CICC вважає, що оптимізація відеопам’яті може знизити вартість генерації одного токена, а отже стимулюватиме користувачів вмикати вищу паралельність і довший контекст; загальний попит на обчислювальні ресурси не зменшиться, а навпаки зростатиме. Водночас модернізація ресурсів зберігання стане ключовою потребою для інференсу поточних AI, і аналітики твердо підтримують тренд зростання сегмента зберігання.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Популярні активності Gate Fun

    Дізнатися більше
  • Рин. кап.:$2.4KХолдери:2
    0.73%
  • Рин. кап.:$2.27KХолдери:2
    0.00%
  • Рин. кап.:$2.33KХолдери:2
    0.00%
  • Рин. кап.:$2.24KХолдери:1
    0.00%
  • Рин. кап.:$2.24KХолдери:1
    0.00%
  • Закріпити