PrismML випустила модель 1.58 біт Ternary Bonsai, зменшення параметрів у 9 разів, що перевищує інтелектуальні можливості аналогів

robot
Генерація анотацій у процесі
ME News Новини, 17 квітня (UTC+8), згідно з моніторингом Датчі Beating, PrismML випустила мовну модель серії Ternary Bonsai, яка за допомогою технології 1.58 біт (ternary weights) зменшує обсяг пам’яті моделі до однієї дев’ятої від 16-бітної моделі, зберігаючи при цьому високі показники продуктивності. Ця серія включає три розміри параметрів: 8B, 4B і 1.7B, і вже відкритий код на Hugging Face, а також підтримує нативне запуск на пристроях Apple.
Так звана модель 1.58 біт означає обмеження ваг нейронної мережі до трьох значень {-1, 0, +1}. У порівнянні з попередніми моделями з максимальною компресією 1 біт (ваги лише {-1, +1}), введення значення «0» дозволяє ефективно видалити зайві з’єднання, що дозволяє зберегти складну здатність до логічних висновків навіть при дуже малому обсязі.
Випущений файл ваг Ternary Bonsai 8B має всього 1,75 ГБ, а його базові тести досягають середнього балу 75,5, що на 5 балів вище за власну 1-бітову версію, а також значно перевищує показники «енергоефективності» (продуктивність на ГБ відеопам’яті) у порівнянні з подібними щільними моделями, такими як Qwen3.
Енергоефективність та швидкість роботи є ще одними ключовими перевагами цієї серії. На iPhone 17 Pro Max швидкість роботи версії 8B досягає 27 токенів за секунду, а коефіцієнт енергоефективності зросла приблизно у 3-4 рази. Це означає, що для розробників, які прагнуть розгортати високопродуктивний AI на мобільних пристроях або ноутбуках, можна досягти майже повної точності моделі за мінімальних витрат пам’яті.
Зараз модель Ternary Bonsai вже підтримується нативно на пристроях Apple через фреймворк MLX. Ваги моделі розповсюджуються за ліцензією Apache 2.0.
(Джерело: BlockBeats)
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 8
  • 5
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
SushiSlippage
· 10год тому
{-1,0,+1} мені нагадує про ті часи BinaryNet, але цього разу здається, що воно справді спрацювало
Переглянути оригіналвідповісти на0
HexiHoodie
· 10год тому
Коефіцієнт енергоефективності підвищився у 3-4 рази, що означає, що час роботи на одному заряді нарешті більше не зменшуватиметься на 50% за півгодини
Переглянути оригіналвідповісти на0
MevInRetrospect
· 10год тому
Apache 2.0 відкритий код — гарна оцінка, це справжній відкритий код, на відміну від деяких, що роблять піар-ходи
Переглянути оригіналвідповісти на0
TheClarityAfterLiquidating
· 10год тому
27 ток/с на телефоні, порівняно з моїм ноутбуком, який працював на 7B, — швидше, часи змінюються
Переглянути оригіналвідповісти на0
0XNightRun
· 10год тому
Підтримка нативного MLX дуже важлива, користувачі екосистеми Apple радіють, їм більше не потрібно морочитися з конвертацією
Переглянути оригіналвідповісти на0
PaperSculptureOctopusPosition
· 10год тому
Ternary Bonsai ця назва досить цікава, тривартісний ваговий коефіцієнт справді є витонченим дизайном рівня кімнатної рослини
Переглянути оригіналвідповісти на0
AutumnSlopeCabin
· 10год тому
Одна дев’ята частина відеопам’яті? Раніше й подумати не міг, тепер iPhone може запускати великі моделі локально.
Переглянути оригіналвідповісти на0
RedTelephoneBoothRuins
· 10год тому
1.75GB запуск 8B моделі, цей коефіцієнт стиснення надзвичайно високий, мобільний AI нарешті можна використовувати
Переглянути оригіналвідповісти на0
  • Закріплено