PrismML lança o modelo de 1.58 bits Ternary Bonsai, redução de parâmetros em 9 vezes, superando outros similares em inteligência

robot
Geração do resumo em andamento
ME News Notícias, 17 de abril (UTC+8), de acordo com o monitoramento do Beating, a PrismML lançou a série de modelos de linguagem Bonsai Ternary, usando a tecnologia de pesos ternários de 1,58 bits, que reduz o uso de memória do modelo para um nono do modelo de 16 bits, mantendo alto desempenho.
A série inclui tamanhos de parâmetro de 8B, 4B e 1,7B, já disponível no Hugging Face como código aberto e suportando execução nativa em dispositivos Apple.
O chamado modelo de 1,58 bits refere-se a limitar os pesos da rede neural a três valores {-1, 0, +1}.
Em comparação com o modelo de 1 bit, que busca compressão extrema (com pesos apenas {-1, +1}), a introdução do valor "0" pode eliminar conexões redundantes, permitindo que o modelo mantenha capacidades de raciocínio complexas mesmo com um tamanho extremamente pequeno.
O arquivo de peso do Bonsai Ternary 8B lançado agora é de apenas 1,75 GB, com uma pontuação média de benchmark de 75,5, superando em 5 pontos a versão de 1 bit da própria empresa, e liderando significativamente em "densidade inteligente" (desempenho por GB de memória de vídeo) em relação a modelos densos semelhantes como o Qwen3.
A eficiência energética e a velocidade de execução são outras vantagens centrais dessa série.
No iPhone 17 Pro Max, a versão de 8B atinge uma velocidade de 27 tok/s, com uma melhora de aproximadamente 3 a 4 vezes na eficiência energética.
Para desenvolvedores que precisam implantar IA de alto desempenho em dispositivos móveis, laptops e outros dispositivos de borda, isso significa obter desempenho inteligente quase completo com um custo de memória extremamente baixo.
Atualmente, o modelo Bonsai Ternary já é suportado nativamente em dispositivos Apple através do estrutura MLX.
Os pesos do modelo são distribuídos sob a licença Apache 2.0.
(Fonte: BlockBeats)
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • 8
  • 5
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
SushiSlippage
· 10h atrás
{-1,0,+1} me faz lembrar do BinaryNet de antigamente, mas desta vez parece que realmente funcionou
Ver originalResponder0
HexiHoodie
· 10h atrás
A relação de eficiência energética aumentou de 3 a 4 vezes, o que significa que a autonomia finalmente não perderá 50% da carga em meia hora.
Ver originalResponder0
MevInRetrospect
· 10h atrás
Apache 2.0 licença de código aberto com boas avaliações, isso é que é verdadeiro código aberto, diferente de alguns que fazem truques
Ver originalResponder0
TheClarityAfterLiquidating
· 10h atrás
27 tok/s em celular, mais rápido do que meu notebook rodando 7B na época, os tempos mudaram
Ver originalResponder0
0XNightRun
· 10h atrás
O suporte nativo do MLX é fundamental, os usuários do ecossistema Apple estão em êxtase, não precisam mais se preocupar com conversões
Ver originalResponder0
PaperSculptureOctopusPosition
· 10h atrás
Ternary Bonsai esse nome é bem interessante, o peso de três valores realmente é um design delicado de nível de um bonsai
Ver originalResponder0
AutumnSlopeCabin
· 10h atrás
Um nono da memória de vídeo? Antes, nem ousávamos sonhar com isso, agora o iPhone consegue rodar grandes modelos localmente.
Ver originalResponder0
RedTelephoneBoothRuins
· 10h atrás
1.75GB para rodar um modelo de 8B, essa taxa de compressão é absurda, a IA móvel finalmente pode ser usada
Ver originalResponder0
  • Fixado