El modelo ternario de 1.58 bits que se ejecuta en Ascend 910B, con la memoria reducida a una sexta parte de BF16, aún puede mantener más del 95% de precisión, ¡por fin la implementación en el borde puede hacerse realidad!

Ver original
MeNews
El primer modelo grande de código abierto de 1.58 bits basado en entrenamiento de pila completa con NPU Huawei Ascend 910B de Huawei ha sido lanzado BitCPM-CANN
BitCPM-CANN fue lanzado conjuntamente por ModelBest, la comunidad de Tsinghua y OpenBMB, siendo el primer modelo de gran escala de 1.58 bits entrenado en el NPU Ascend 910B en todo el mundo.
Utiliza cuantización de peso en modo tri-estado con bits extremadamente bajos, reduciendo el uso de memoria en aproximadamente 6 veces en comparación con BF16, y es compatible con dispositivos edge como teléfonos móviles, computadoras y vehículos.
El stack de entrenamiento está completamente nativo en Ascend, y la familia de modelos de 0.5B a 8B alcanza un rendimiento del 95-97% en precisión total en varias métricas, haciendo que su implementación y despliegue sean más factibles.
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado