PrismML تطلق نموذج 1.58 بيت Ternary Bonsai، وتقليل المعلمات بمقدار 9 مرات، مما يعزز الذكاء ويتفوق على النظائر

robot
إنشاء الملخص قيد التقدم
أخبار ME News، 17 أبريل (بتوقيت UTC+8)، وفقًا لمراقبة Beating، أطلقت PrismML سلسلة نماذج لغة Bonsai الثلاثية، باستخدام تقنية الأوزان الثلاثية 1.58 بت، مما يقلل من استهلاك ذاكرة النموذج إلى تسعة أضعاف نموذج 16 بت مع الحفاظ على الأداء العالي. تتضمن السلسلة ثلاثة أحجام من المعلمات: 8 مليار، 4 مليار و1.7 مليار، وهي متاحة الآن كمصدر مفتوح على Hugging Face وتدعم التشغيل الأصلي على أجهزة أبل.
ما يُسمى بنموذج 1.58 بت هو أن الأوزان في الشبكة العصبية مقيدة إلى القيم {-1، 0، +1}. بالمقارنة مع نموذج 1 بت السابق الذي كان يهدف إلى ضغط أقصى (الأوزان فقط {-1، +1})، فإن إدخال قيمة "0" يمكن أن يزيل الاتصالات الزائدة بشكل فعال، مما يسمح للنموذج بالحفاظ على قدرات استنتاج معقدة بحجم صغير جدًا.
حجم ملف وزن Bonsai الثلاثي 8B الذي تم إصداره حديثًا هو فقط 1.75 جيجابايت، ومتوسط نتائج الاختبار القياسية وصل إلى 75.5، وهو أعلى بخمس نقاط من الإصدار 1 بت الخاص بهم، ويتفوق بشكل كبير على نماذج كثيفة مماثلة مثل Qwen3 من حيث "الكثافة الذكية" (الأداء لكل جيجابايت من الذاكرة).
كفاءة الطاقة وسرعة التشغيل هما ميزة رئيسية أخرى لهذه السلسلة. على iPhone 17 Pro Max، تصل سرعة تشغيل إصدار 8B إلى 27 توك/ث، مع زيادة كفاءة الطاقة بمقدار 3 إلى 4 مرات تقريبًا.
بالنسبة للمطورين الذين يحتاجون إلى نشر ذكاء اصطناعي عالي الأداء على أجهزة الهاتف المحمول، الكمبيوتر المحمول، وغيرها من الأجهزة الطرفية، فهذا يعني أنه يمكنهم استبدال ذاكرة صغيرة جدًا بأداء ذكي يقارب النموذج الكامل الدقة.
حاليًا، تم دعم نموذج Bonsai الثلاثي على أجهزة أبل بشكل أصلي عبر إطار عمل MLX. يتم توزيع أوزان النموذج بموجب بروتوكول Apache 2.0.
(المصدر: BlockBeats)
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 8
  • 7
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
WalletHealthInspector
· منذ 3 س
الكمية الثلاثية + MLX مدمجة بشكل أصلي، بيئة أبل مغلقة، وضغط كبير على نظام أندرويد
شاهد النسخة الأصليةرد0
RouterRunner
· منذ 8 س
متقدمًا بمقدار 75.5 نقطة على نظائره، لكن كم هو الفرق مقارنة بالدقة الكاملة؟ هل هناك تجارب إلغاء التجربة لرؤية الفرق؟
شاهد النسخة الأصليةرد0
NeonFusionIceCream
· منذ 8 س
تم تقليل ذاكرة الفيديو إلى 1/9، وانخفضت تكلفة النشر على الحافة بشكل حاد، يبدو أن نقطة التحول في الذكاء الاصطناعي على الجانب النهائي قد وصلت حقًا
شاهد النسخة الأصليةرد0
GateUser-c29c3db9
· منذ 8 س
آيفون 17 برو ماكس بسرعة 27 توكين/ثانية، وحدة المعالجة العصبية (NPU) في شرائح أبل أخيرًا استُنفدت، نظام بيئي MLX على وشك الانطلاق
شاهد النسخة الأصليةرد0
OrderCancellerAfterTheRain
· منذ 8 س
اسم Bonsai جيد، حيث تم تقليم الشجرة حتى تبقى فقط على ثلاث قيم، والنموذج بالفعل يشبه تصميم بونساي بدقة عالية
شاهد النسخة الأصليةرد0
TvlTeaTime
· منذ 8 س
إصدار Apache 2.0 مفتوح المصدر جيد، لكنني فضولي حول كيفية التدريب، وكيفية تنفيذ الانتشار العكسي للأوزان ذات القيم الثلاثة
شاهد النسخة الأصليةرد0
GateUser-8ca669fd
· منذ 8 س
الكمية ذات الثلاث قيم {-1، 0، +1}، الفكرة الموجودة في الأوراق القديمة أصبحت قابلة للتنفيذ، وقد قام فريق PrismML بتنفيذها بشكل رائع في هذا المشروع
شاهد النسخة الأصليةرد0
BugBountyBuddy
· منذ 8 س
1.75 جيجابايت لتشغيل 8 بي؟ هذا معدل ضغط غير معقول، أخيرًا لم يعد تشغيل النماذج الكبيرة على الهاتف المحلي حلمًا
شاهد النسخة الأصليةرد0
  • مُثبت