PrismML lanza la serie Ternary Bonsai, que utiliza pesos de 1.58 bits {-1,0,+1}, con un tamaño de memoria solo una novena del modelo de 16 bits. Las versiones de 8B/4B/1.7B ya están abiertas en Hugging Face y se ejecutan de forma nativa en dispositivos Apple. El peso de 8B es aproximadamente 1.75 GB, con una puntuación de referencia de 75.5, liderando en su categoría. En el iPhone 17 Pro Max, la velocidad de 8B es de 27 tokens/segundo, con una mejora en eficiencia energética de 3 a 4 veces. Los pesos se distribuyen bajo Apache 2.0 y se ejecutan de forma nativa en dispositivos Apple a través del marco MLX.

MeNews

2026-05-21 00:45:33

Generación de resúmenes en curso

ME News Noticias, 17 de abril (UTC+8), según la monitorización de Dongcha Beating, PrismML lanzó la serie de modelos de lenguaje Ternary Bonsai, que mediante la tecnología de pesos ternarios de 1.58 bits, reduce el uso de memoria del modelo a una novena del tamaño del modelo de 16 bits, manteniendo un alto rendimiento. La serie incluye modelos con 8B, 4B y 1.7B parámetros, ya disponibles en open source en Hugging Face y soportando ejecución nativa en dispositivos Apple.
El llamado modelo de 1.58 bits se refiere a limitar los pesos de la red neuronal a los valores {-1, 0, +1}. En comparación con el modelo de 1 bit, que busca una compresión extrema (con pesos solo {-1, +1}), la introducción del valor «0» puede eliminar conexiones redundantes, permitiendo que el modelo conserve capacidades de razonamiento complejas en un tamaño muy reducido.
El archivo de peso de 8B de Ternary Bonsai lanzado esta vez tiene solo 1.75 GB, y su puntuación en pruebas de referencia alcanza 75.5, superando en 5 puntos a su versión de 1 bit, e incluso liderando significativamente en «densidad inteligente» (rendimiento por GB de memoria de video) en comparación con modelos densos similares como Qwen3.
La eficiencia energética y la velocidad de ejecución son otra ventaja clave de esta serie. En el iPhone 17 Pro Max, la versión de 8B puede alcanzar una velocidad de 27 tok/s, con una mejora en la relación de eficiencia energética de aproximadamente 3 a 4 veces. Esto significa que los desarrolladores que necesitan desplegar IA de alto rendimiento en dispositivos móviles, portátiles y otros dispositivos en el borde, pueden obtener un rendimiento cercano al de modelos de precisión completa con un consumo de memoria muy reducido.
Actualmente, los modelos Ternary Bonsai ya cuentan con soporte nativo en dispositivos Apple a través del framework MLX. Los pesos del modelo se distribuyen bajo la licencia Apache 2.0.
(Origen: BlockBeats)

Ver original

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

8 me gusta

Recompensa
8
8
12
Compartir

Comentar

Añadir un comentario

GateUser-44dde53b

· hace13h

La eficiencia energética aumenta de 3 a 4 veces, la presión de la batería en esta generación de iPhone será menor.

Ver originalResponder0

Neon-LitStreetsAfterTheRain

· hace14h

Los datos de prueba del iPhone 17 Pro Max están aquí, mucho más que en la presentación.

Ver originalResponder0

NeonFusionIceCream

· hace14h

{-1,0,+1} pesos de tres valores, cuantificado al máximo aún puede mantener una puntuación de 75.5, la capacidad de ingeniería puede

Ver originalResponder0

TreatMemesAsBeliefs

· hace14h

Instrucciones de adaptación del marco MLX: la estrategia de IA en el ecosistema de Apple se profundiza cada vez más

Ver originalResponder0

QuantizedDaydream

· hace14h

Aprobación positiva de la licencia Apache 2.0, la amistad comercial es clave para expandirse

Ver originalResponder0

HaiyanColdWallet

· hace14h

Hugging Face ya es de código abierto, este fin de semana prueba el rendimiento de la versión 4B

Ver originalResponder0

GlassBottleFeather

· hace14h

Dispositivo Apple ejecutando nativamente el modelo 8B, con una velocidad de 27 tok/s, esto se puede usar en el teléfono.

Ver originalResponder0

NeonMint

· hace14h

1.58 bits es demasiado fuerte, la memoria gráfica se redujo directamente a 1/9, me rindo ante esa tasa de compresión

Ver originalResponder0

Temas de actualidad
Ver más
#
TradfiTradingChallenge
227.78K Popularidad
#
GrayscaleBuysAndStakesOver510KHYPE
8.91M Popularidad
#
IsraelStrikesIranBTCPlunges
48.48K Popularidad
#
#DailyPolymarketHotspot
1.01M Popularidad
#
SpaceXOfficiallyFilesforIPO
748.48K Popularidad

Fijado

PrismML lanza el modelo de 1.58 bits Ternary Bonsai, reducción de parámetros en 9 veces, superando en inteligencia a modelos similares

Temas de actualidad

TradfiTradingChallenge

GrayscaleBuysAndStakesOver510KHYPE

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

SpaceXOfficiallyFilesforIPO

Fijado