PrismML تطلق نموذج 1.58 بيت Ternary Bonsai، وتقليل المعلمات بمقدار 9 مرات، مما يعزز الذكاء ويتفوق على النظائر

robot
إنشاء الملخص قيد التقدم
أخبار ME، 17 أبريل (بتوقيت UTC+8)، وفقًا لمراقبة Beating، أطلقت PrismML سلسلة نماذج لغة Bonsai الثلاثية، باستخدام تقنية 1.58 بت (الأوزان الثلاثية) لتقليل استهلاك ذاكرة النموذج إلى تسعة أضعاف نموذج 16 بت، مع الحفاظ على الأداء العالي. تتضمن السلسلة ثلاثة أحجام من المعلمات: 8 مليار، 4 مليار و1.7 مليار، وهي متاحة الآن كمصدر مفتوح على Hugging Face وتدعم التشغيل الأصلي على أجهزة أبل.
ما يُسمى بنموذج 1.58 بت، هو تحديد أوزان الشبكة العصبية لتكون ضمن القيم {-1، 0، +1}. بالمقارنة مع نموذج 1 بت السابق الذي كان يهدف إلى ضغط أقصى (الأوزان فقط {-1، +1})، فإن إدخال قيمة "0" يمكن من إزالة الاتصالات الزائدة بشكل فعال، مما يسمح للنموذج بالحفاظ على قدرات استنتاج معقدة بحجم صغير جدًا.
حجم ملف وزن Bonsai الثلاثي 8B الذي تم إصداره حديثًا هو فقط 1.75 جيجابايت، ومتوسط نتائج الاختبار الأساسية وصل إلى 75.5، وهو أعلى بخمس نقاط من الإصدار 1 بت الخاص بهم، ويتفوق بشكل كبير على نماذج كثيفة مماثلة مثل Qwen3 من حيث "كثافة الذكاء" (الأداء لكل جيجابايت من الذاكرة).
نسبة الكفاءة في الأداء وسرعة التشغيل هي ميزة رئيسية أخرى لهذه السلسلة. على iPhone 17 Pro Max، يمكن لنموذج 8B أن يعمل بسرعة تصل إلى 27 توكين في الثانية، مع زيادة بنسبة 3 إلى 4 مرات في كفاءة الأداء.
بالنسبة للمطورين الذين يحتاجون إلى نشر ذكاء اصطناعي عالي الأداء على أجهزة الهاتف المحمول، الحاسوب المحمول، وغيرها من الأجهزة الطرفية، فهذا يعني أنه يمكنهم استبدال ذاكرة صغيرة جدًا بأداء ذكاء يقارب النموذج الكامل الدقة.
حاليًا، تم دعم نموذج Bonsai الثلاثي على أجهزة أبل بشكل أصلي عبر إطار عمل MLX. وتوزع أوزان النموذج بموجب بروتوكول Apache 2.0.
(المصدر: BlockBeats)
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 8
  • 5
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
SushiSlippage
· منذ 9 س
{-1,0,+1} تذكرني بـBinaryNet في ذلك الوقت، لكن هذه المرة يبدو أنها فعلاً نجحت
شاهد النسخة الأصليةرد0
HexiHoodie
· منذ 9 س
تحسين نسبة الكفاءة بمقدار 3-4 مرات، يعني أن عمر البطارية لن ينقص بعد نصف ساعة من الاستخدام بنسبة 50% بعد الآن
شاهد النسخة الأصليةرد0
MevInRetrospect
· منذ 9 س
إعجاب كبير بمصدر Apache 2.0 المفتوح، هذا هو المصدر الحقيقي، على عكس بعض الذين يثيرون الضجة
شاهد النسخة الأصليةرد0
TheClarityAfterLiquidating
· منذ 9 س
27 توكن/ثانية على الهاتف، أسرع من تشغيل 7B على لابتوبي في ذلك الوقت، تغيرت الأزمنة
شاهد النسخة الأصليةرد0
0XNightRun
· منذ 9 س
الدعم الأصلي لـ MLX مهم جدًا، مستخدمو نظام أبل بيئة مفرحين، لا حاجة للعبث بالتحويلات
شاهد النسخة الأصليةرد0
PaperSculptureOctopusPosition
· منذ 9 س
اسم Ternary Bonsai ممتع جدًا، فإن الوزن الثلاثي فعلاً تصميم دقيق من مستوى بونساي
شاهد النسخة الأصليةرد0
AutumnSlopeCabin
· منذ 9 س
السدس من ذاكرة الفيديو؟ لم أكن أجرؤ على التفكير في ذلك من قبل، والآن يمكن لـ iPhone تشغيل النماذج الكبيرة محليًا.
شاهد النسخة الأصليةرد0
RedTelephoneBoothRuins
· منذ 9 س
1.75 جيجابايت لتشغيل نموذج 8B، نسبة الضغط هذه مذهلة جدًا، أخيرًا يمكن استخدام الذكاء الاصطناعي على الأجهزة المحمولة
شاهد النسخة الأصليةرد0
  • مُثبت