CITIC Securities: La capacidad de almacenamiento se actualiza como la necesidad central del razonamiento en los agentes inteligentes actuales

robot
Generación de resúmenes en curso

Noticia diaria de AI de Every Daily (每经AI快讯): un informe de CICC (CITIC Securities) afirma que la IA evoluciona desde “conversación simple” hacia “agentes (Agent)”, impulsando un aumento explosivo de la longitud de contexto. Según datos de Epoch AI, la ventana de contexto más larga crece aproximadamente 30x cada año. Existe una relación de crecimiento lineal entre la capacidad de memoria de la KV Cache y la longitud de contexto, muy por encima de la tasa de mejora del rendimiento del hardware. Actualmente, los principales fabricantes de modelos grandes y de hardware solucionan el cuello de botella de capacidad de cómputo principalmente mediante cuantización, almacenamiento jerárquico y optimización de la arquitectura del modelo, pero aun así no cambian la necesidad de memoria de vídeo. CICC considera que la optimización de la memoria de vídeo podría reducir el costo de generación por token, lo que a su vez estimularía a los usuarios a activar mayor concurrencia y contextos más largos. La demanda total de capacidad no disminuirá, sino que aumentará; la actualización de capacidad se convertirá en la necesidad central para la inferencia de agentes en la actualidad. Se mantiene una sólida visión alcista sobre la tendencia de crecimiento del almacenamiento.

Diario de noticias económicas (每日经济新闻)

(Edición: 董萍萍 )

     【Aviso legal】Este artículo solo representa las opiniones personales del autor y no tiene relación con Hexun. El sitio de Hexun mantiene una postura neutral con respecto a las afirmaciones, opiniones y juicios incluidos en el texto, y no ofrece ninguna garantía expresa o implícita sobre la exactitud, confiabilidad o integridad de los contenidos. Se ruega a los lectores que solo tomen esto como referencia y asuman toda la responsabilidad por su cuenta. Correo electrónico: news_center@staff.hexun.com

Reportar

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado