PrismML випустила модель 1.58 біт Ternary Bonsai, зменшення параметрів у 9 разів, що перевищує інтелектуальні можливості аналогів

robot
Генерація анотацій у процесі
ME News Новини, 17 квітня (UTC+8), згідно з моніторингом Датчі Beating, PrismML випустила мовну модель серії Ternary Bonsai, яка за допомогою технології 1.58 біт (ternary weights) зменшує обсяг пам’яті моделі до однієї дев’ятої від 16-бітної моделі, зберігаючи при цьому високі показники продуктивності. Ця серія включає три розміри параметрів: 8B, 4B і 1.7B, і вже відкрито доступна на Hugging Face, а також підтримує нативне запускання на пристроях Apple.
Так звана модель 1.58 біт означає обмеження ваг нейронної мережі до трьох значень {-1, 0, +1}. У порівнянні з попередніми моделями з максимальною компресією 1 біт (ваги лише {-1, +1}), введення значення «0» дозволяє ефективно видалити зайві з’єднання, що дозволяє зберегти складну здатність до логічних висновків навіть при дуже малому обсязі.
Опублікований файл ваг Ternary Bonsai 8B має всього 1,75 ГБ, а його базовий тестовий бал досягає 75,5, що на 5 балів вище за власну 1-бітову версію, а також значно перевищує показники подібних щільних моделей, таких як Qwen3, у «інтелектуальній щільності» (продуктивність на один ГБ відеопам’яті).
Енергоефективність і швидкість роботи є ще одними ключовими перевагами цієї серії. На iPhone 17 Pro Max швидкість роботи версії 8B досягає 27 токенів за секунду, а коефіцієнт енергоефективності зросла приблизно у 3-4 рази. Це означає, що для розробників, які прагнуть запускати високопродуктивний AI на мобільних пристроях або ноутбуках, можна досягти майже повної точності моделі за дуже малий об’єм пам’яті.
Зараз модель Ternary Bonsai вже підтримується нативно на пристроях Apple через фреймворк MLX. Ваги моделі розповсюджуються за ліцензією Apache 2.0.
(Джерело: BlockBeats)
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 8
  • 12
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
GateUser-44dde53b
· 13год тому
Ефективність підвищилася в 3-4 рази, тож навантаження на акумулятор цього покоління iPhone стане меншим.
Переглянути оригіналвідповісти на0
Neon-LitStreetsAfterTheRain
· 13год тому
Дані реальних тестів iPhone 17 Pro Max набагато переконливіші, ніж у презентації PPT
Переглянути оригіналвідповісти на0
NeonFusionIceCream
· 13год тому
{-1,0,+1} трьохзначні ваги, при максимально можливому кількості квантованих залишаються 75.5 балів, інженерна майстерність можлива
Переглянути оригіналвідповісти на0
TreatMemesAsBeliefs
· 13год тому
Інструкція з адаптації фреймворку MLX: все глибше впровадження AI-екосистеми Apple
Переглянути оригіналвідповісти на0
QuantizedDaydream
· 13год тому
Apache 2.0 ліцензія отримує позитивні відгуки, бізнес-дружність — ключ до розповсюдження
Переглянути оригіналвідповісти на0
HaiyanColdWallet
· 13год тому
Hugging Face вже відкритий код, у вихідні спробуйте версію 4B для результату
Переглянути оригіналвідповісти на0
GlassBottleFeather
· 13год тому
Apple пристрій нативно запускає модель 8B, швидкість 27 токенів/с — це можна використовувати на телефоні
Переглянути оригіналвідповісти на0
NeonMint
· 13год тому
1.58 біт занадто жорстко, відеопам’ять одразу зменшили до 1/9, цей ступінь стиснення мене вразив
Переглянути оригіналвідповісти на0
  • Закріплено