PrismML lanza el modelo de 1.58 bits Ternary Bonsai, reducción de parámetros en 9 veces, superando en inteligencia a modelos similares

robot
Generación de resúmenes en curso
ME News Noticias, 17 de abril (UTC+8), según la monitorización de Dongcha Beating, PrismML lanzó la serie de modelos de lenguaje Ternary Bonsai, que mediante la tecnología de pesos ternarios de 1.58 bits, reduce el uso de memoria del modelo a una novena del tamaño del modelo de 16 bits, manteniendo un alto rendimiento. La serie incluye modelos con 8B, 4B y 1.7B parámetros, ya disponibles en open source en Hugging Face y soportando ejecución nativa en dispositivos Apple.
El llamado modelo de 1.58 bits se refiere a limitar los pesos de la red neuronal a los valores {-1, 0, +1}. En comparación con el modelo de 1 bit, que busca una compresión extrema (con pesos solo {-1, +1}), la introducción del valor «0» puede eliminar conexiones redundantes, permitiendo que el modelo conserve capacidades de razonamiento complejas en un tamaño muy reducido.
El archivo de peso de 8B de Ternary Bonsai lanzado esta vez tiene solo 1.75 GB, y su puntuación en pruebas de referencia alcanza 75.5, superando en 5 puntos a su versión de 1 bit, e incluso liderando significativamente en «densidad inteligente» (rendimiento por GB de memoria de video) en comparación con modelos densos similares como Qwen3.
La eficiencia energética y la velocidad de ejecución son otra ventaja clave de esta serie. En el iPhone 17 Pro Max, la versión de 8B puede alcanzar una velocidad de 27 tok/s, con una mejora en la relación de eficiencia energética de aproximadamente 3 a 4 veces. Esto significa que los desarrolladores que necesitan desplegar IA de alto rendimiento en dispositivos móviles, portátiles y otros dispositivos en el borde, pueden obtener un rendimiento cercano al de modelos de precisión completa con un consumo de memoria muy reducido.
Actualmente, los modelos Ternary Bonsai ya cuentan con soporte nativo en dispositivos Apple a través del framework MLX. Los pesos del modelo se distribuyen bajo la licencia Apache 2.0.
(Origen: BlockBeats)
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 8
  • 12
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
GateUser-44dde53b
· hace13h
La eficiencia energética aumenta de 3 a 4 veces, la presión de la batería en esta generación de iPhone será menor.
Ver originalResponder0
Neon-LitStreetsAfterTheRain
· hace14h
Los datos de prueba del iPhone 17 Pro Max están aquí, mucho más que en la presentación.
Ver originalResponder0
NeonFusionIceCream
· hace14h
{-1,0,+1} pesos de tres valores, cuantificado al máximo aún puede mantener una puntuación de 75.5, la capacidad de ingeniería puede
Ver originalResponder0
TreatMemesAsBeliefs
· hace14h
Instrucciones de adaptación del marco MLX: la estrategia de IA en el ecosistema de Apple se profundiza cada vez más
Ver originalResponder0
QuantizedDaydream
· hace14h
Aprobación positiva de la licencia Apache 2.0, la amistad comercial es clave para expandirse
Ver originalResponder0
HaiyanColdWallet
· hace14h
Hugging Face ya es de código abierto, este fin de semana prueba el rendimiento de la versión 4B
Ver originalResponder0
GlassBottleFeather
· hace14h
Dispositivo Apple ejecutando nativamente el modelo 8B, con una velocidad de 27 tok/s, esto se puede usar en el teléfono.
Ver originalResponder0
NeonMint
· hace14h
1.58 bits es demasiado fuerte, la memoria gráfica se redujo directamente a 1/9, me rindo ante esa tasa de compresión
Ver originalResponder0
  • Fijado