Acabo de ver que DeepSeek-V4 es de código abierto, esta actualización es realmente impresionante. La ventana de contexto de 1MB junto con el algoritmo de compresión KV Cache mejora claramente la capacidad de manejar secuencias largas. Sin embargo, esto también presenta desafíos para la infraestructura. Escuché que la solución de IA DCS de Huawei ya está completamente adaptada, utilizan sus ventajas de hardware y software de pila completa para realizar optimizaciones a nivel de sistema. Parece que el conjunto de soluciones DCS tiene algo interesante en cuanto a las necesidades de infraestructura para modelos grandes. ¿Han utilizado alguna vez la solución DCS?

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado