Huawei lanza la solución integral de infraestructura de datos AI DC

robot
Generación de resúmenes en curso
Noticias de Mars Finance 22 de mayo: Huawei lanzó oficialmente la solución de infraestructura de datos de pila completa AI DC, el almacenamiento distribuido de estado sólido OceanStor Pacific con una capacidad líder en la industria de 11PB/2U, logrando la mejor relación TCO para almacenar datos masivos. Dirigido a escenarios de clústeres de inferencia a gran escala, Huawei presentó el primer almacenamiento de memoria contextual que soporta cálculo heterogéneo, CMS (Context Memory Storage), que soporta la transferencia directa de semántica KV o utiliza DPU dedicado para descarga de semántica, y puede escalarse a un pool compartido de caché KV de nivel PB, reduciendo la latencia del primer token de inferencia en un 90%. Para escenarios empresariales de inferencia de IA, Huawei innovó con la plataforma de datos de IA "3+1", que integra una base de conocimientos con más del 95% de precisión en recuperación, caché KV acelerada y una memoria en evolución continua, gestionada mediante tecnología UCM para mejorar la precisión de la inferencia en un 30%. (Observación panorámica)
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 12
  • 1
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
ColdBrewYield
· hace5h
La solución de pila completa de Huawei en esta ola, integración del contexto de almacenamiento y potencia de cálculo, y un mayor avance en la sustitución nacional
Ver originalResponder0
GateUser-8ca669fd
· hace6h
La plataforma 3+1 con esa precisión de búsqueda del 95%, la implementación empresarial debería poder evitar muchos errores.
Ver originalResponder0
YieldYeti
· hace6h
Cache KV de almacenamiento compartido, ¿la inferencia en múltiples tarjetas puede mejorar mucho la eficiencia?
Ver originalResponder0
PineNeedlesAndColdWind
· hace6h
DPU descarga de KV semántica, optimización a nivel de hardware, los entusiastas de los detalles están encantados
Ver originalResponder0
MevTeaTime
· hace6h
La precisión en el razonamiento empresarial se ha incrementado en un 30%, y el ROI de implementación ya es rentable.
Ver originalResponder0
OldKeyboardTraitor
· hace6h
El punto de que la base de datos de memoria evoluciona continuamente, parece estar haciendo memoria a largo plazo.
Ver originalResponder0
0xSideQuest
· hace6h
Esperar a los casos de implementación reales, los parámetros técnicos son atractivos, pero la verdadera prueba es la ingeniería.
Ver originalResponder0
NekoOnCall
· hace6h
OceanStor Pacific, este nombre suena impresionante, todo en flash + distribuido, una bestia en rendimiento
Ver originalResponder0
NeonVortexTunnel
· hace6h
La gestión del contexto en clústeres de ultra gran escala ha sido un problema persistente, y CMS es una solución específica para ello.
Ver originalResponder0
Frost-ColoredCubeCity
· hace6h
Desde el entrenamiento hasta la inferencia, cobertura de toda la cadena, Huawei tiene grandes ambiciones en infraestructura de IA
Ver originalResponder0
Ver más
  • Fijado