PrismML تطلق نموذج 1.58 بيت Ternary Bonsai، وتقليل المعلمات بمقدار 9 مرات، مما يعزز الذكاء ويتفوق على النظائر

robot
إنشاء الملخص قيد التقدم
أخبار ME، 17 أبريل (بتوقيت UTC+8)، وفقًا لمراقبة Beating، أطلقت PrismML سلسلة نماذج لغة Bonsai الثلاثية، باستخدام تقنية 1.58 بت (أوزان ثلاثية) لتقليل استهلاك ذاكرة النموذج إلى تسعة أضعاف نموذج 16 بت، مع الحفاظ على الأداء العالي. تتضمن السلسلة ثلاثة أحجام من المعلمات: 8 مليار، 4 مليار و1.7 مليار، وهي متاحة الآن كمصدر مفتوح على Hugging Face وتدعم التشغيل الأصلي على أجهزة أبل.
ما يُسمى بنموذج 1.58 بت، هو تحديد أوزان الشبكة العصبية لتكون ضمن القيم {-1، 0، +1}. بالمقارنة مع نموذج 1 بت السابق الذي كان يهدف إلى ضغط أقصى (الأوزان فقط {-1، +1})، فإن إدخال قيمة "0" يمكن من إزالة الاتصالات الزائدة بشكل فعال، مما يسمح للنموذج بالحفاظ على قدرات استنتاج معقدة بحجم صغير جدًا.
حجم ملف وزن Bonsai الثلاثي 8B الذي تم إصداره حديثًا هو فقط 1.75 جيجابايت، وحقق متوسط ​​اختبار قياسي 75.5، وهو أعلى بخمس نقاط من الإصدار 1 بت الخاص بهم، ويتفوق بشكل كبير على نماذج كثيفة مماثلة مثل Qwen3 من حيث "الكثافة الذكية" (الأداء لكل جيجابايت من الذاكرة).
نسبة الكفاءة والأداء هي ميزة رئيسية أخرى لهذه السلسلة. على iPhone 17 Pro Max، يمكن أن تصل سرعة التشغيل إلى 27 توكين في الثانية، مع زيادة بنسبة 3 إلى 4 مرات في كفاءة الطاقة.
بالنسبة للمطورين الذين يحتاجون إلى نشر ذكاء اصطناعي عالي الأداء على الأجهزة المحمولة واللابتوب، فهذا يعني أنه يمكنهم استبدال ذاكرة صغيرة جدًا بأداء قريب من النماذج ذات الدقة الكاملة.
حاليًا، تم دعم نموذج Bonsai الثلاثي على أجهزة أبل بشكل أصلي عبر إطار عمل MLX.
تم توزيع أوزان النموذج بموجب بروتوكول Apache 2.0.
(المصدر: BlockBeats)
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 8
  • 12
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
GateUser-44dde53b
· منذ 13 س
تحسين الكفاءة بنسبة 3-4 مرات، يمكن أن يقلل من ضغط عمر البطارية في هذا الجيل من iPhone
شاهد النسخة الأصليةرد0
Neon-LitStreetsAfterTheRain
· منذ 13 س
بيانات الاختبار الفعلية لـ iPhone 17 Pro Max تظهر بشكل واضح، أكثر بكثير من عرض الشرائح التقديمية
شاهد النسخة الأصليةرد0
NeonFusionIceCream
· منذ 13 س
{-1،0،+1} وزن ثلاثي القيم، مع التكميم إلى أقصى حد يمكن أن يحافظ على 75.5 نقطة، القدرة الهندسية ممكنة
شاهد النسخة الأصليةرد0
TreatMemesAsBeliefs
· منذ 13 س
شرح توافق إطار MLX وتعمق تخطيط الذكاء الاصطناعي في نظام بيئة أبل
شاهد النسخة الأصليةرد0
QuantizedDaydream
· منذ 13 س
رخصة أباتشي 2.0 تحظى بتقييم إيجابي، والود التجاري هو الذي يمكن أن يوسع الانتشار
شاهد النسخة الأصليةرد0
HaiyanColdWallet
· منذ 13 س
Hugging Face مفتوحة المصدر، جرب إصدار 4B خلال عطلة نهاية الأسبوع
شاهد النسخة الأصليةرد0
GlassBottleFeather
· منذ 13 س
تشغيل نموذج 8B بشكل أصلي على أجهزة آبل، بسرعة 27 توك/ثانية، هل يمكن استخدامه على الهاتف؟
شاهد النسخة الأصليةرد0
NeonMint
· منذ 13 س
1.58 بيت كانت قوية جدًا، تم تقليل الذاكرة مباشرة إلى 1/9، أنا معجب بنسبة الضغط هذه
شاهد النسخة الأصليةرد0
  • مُثبت