PrismML تطلق نموذج 1.58 بيت تيرنري بونساي، وتقليل المعلمات بمقدار 9 مرات، مما يعزز الذكاء ويتفوق على النظائر

robot
إنشاء الملخص قيد التقدم
أخبار ME، 17 أبريل (بتوقيت UTC+8)، وفقًا لمراقبة Beating، أطلقت PrismML سلسلة نماذج لغة Bonsai الثلاثية، باستخدام تقنية الأوزان الثلاثية 1.58 بت، مما يقلل من استهلاك ذاكرة النموذج إلى تسعة أضعاف نموذج 16 بت مع الحفاظ على الأداء العالي. تتضمن السلسلة ثلاثة أحجام من المعلمات: 8 مليار، 4 مليار و1.7 مليار، وهي متاحة الآن كمصدر مفتوح على Hugging Face وتدعم التشغيل الأصلي على أجهزة أبل.
ما يُسمى بنموذج 1.58 بت هو أن الأوزان في الشبكة العصبية مقيدة إلى القيم الثلاثة {-1، 0، +1}. بالمقارنة مع نموذج 1 بت السابق الذي كان يهدف إلى ضغط أقصى (الأوزان فقط {-1، +1})، فإن إدخال قيمة "0" يمكن من إزالة الاتصالات الزائدة بشكل فعال، مما يسمح للنموذج بالحفاظ على قدرات استنتاج معقدة بحجم صغير جدًا.
حجم ملف وزن Bonsai الثلاثي 8B الذي تم إصداره حديثًا هو فقط 1.75 جيجابايت، ومتوسط نتائج الاختبار القياسي وصل إلى 75.5، وهو أعلى بخمس نقاط من الإصدار 1 بت الخاص بهم، ويتفوق بشكل كبير على نماذج كثيفة مماثلة مثل Qwen3 من حيث "كثافة الذكاء" (الأداء لكل جيجابايت من الذاكرة).
نسبة الكفاءة في الأداء وسرعة التشغيل هي ميزة رئيسية أخرى لهذه السلسلة. على iPhone 17 Pro Max، تصل سرعة تشغيل إصدار 8B إلى 27 توكين في الثانية، مع زيادة بنسبة 3 إلى 4 مرات في كفاءة الأداء.
بالنسبة للمطورين الذين يحتاجون إلى نشر ذكاء اصطناعي عالي الأداء على أجهزة الهاتف المحمول، الحاسوب المحمول، وغيرها من الأجهزة الطرفية، فهذا يعني أنه يمكنهم استبدال ذاكرة صغيرة جدًا بأداء ذكاء يقارب النموذج الكامل الدقة.
حاليًا، تم دعم نموذج Bonsai الثلاثي على أجهزة أبل بشكل أصلي عبر إطار عمل MLX. يتم توزيع أوزان النموذج بموجب بروتوكول Apache 2.0.
(المصدر: BlockBeats)
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 9
  • 10
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
OldKeyboardTraitor
· منذ 8 س
تحويل الأوزان إلى ثلاث قيم في الواقع أصعب بكثير من التثليث، وجود الصفر يجعل الاحتفاظ بالمعلومات أكثر مرونة، وخطوة PrismML تم اختيارها بدقة.
شاهد النسخة الأصليةرد0
BoredInBlockspace
· منذ 8 س
1.75 جيجابايت لاحتواء 8 مليار معلمة، هل أصبح تشغيل نماذج اللغة الكبيرة محليًا هو الوضع الطبيعي في المستقبل؟
شاهد النسخة الأصليةرد0
0xLateDiner
· منذ 8 س
1.58 وزن البت قوي جدًا، تم تقليل الذاكرة مباشرة إلى واحد من تسعة، معدل الضغط هذا له قيمة معينة
شاهد النسخة الأصليةرد0
GateUser-0f33f9ef
· منذ 8 س
{-1،0،+1} التكميم بثلاث قيم، الأناقة الرياضية أصبحت واقعا في الهندسة أيضا
شاهد النسخة الأصليةرد0
ProofOfSnack
· منذ 8 س
اسم Ternary Bonsai رائع، فالقيم الثلاثة تشبه تقليم الأشجار الصغيرة، تبسيط الأمور وإزالة الزوائد
شاهد النسخة الأصليةرد0
BerryColdWallet
· منذ 8 س
تشغيل نموذج 8B على iPhone بسرعة 27 توكين/ثانية؟ مستخدمو آبل في غاية السعادة
شاهد النسخة الأصليةرد0
GateUser-e1cfc287
· منذ 8 س
تحسين نسبة الكفاءة بمقدار 3-4 مرات، والقلق بشأن استهلاك الطاقة في الذكاء الاصطناعي الطرفي قد تم حله
شاهد النسخة الأصليةرد0
L2Mailman
· منذ 8 س
يدعم MLX بشكل أصلي، وإضافة قطعة جديدة إلى الحلقة المغلقة لنظام آبل البيئي
شاهد النسخة الأصليةرد0
FoldedCosmosCat
· منذ 8 س
مفتوح المصدر + أباتشي 2.0، هذه الموجة من PrismML فتحت آفاق جديدة
شاهد النسخة الأصليةرد0
عرض المزيد
  • مُثبت