تشغيل النماذج الكبيرة محليًا أخيرًا لم يعد يتطلب النظر إلى مزاج السحابة، ضغط بمقدار 5 مرات مع الحفاظ على الجودة، هذه الموجة من TurboQuant المفتوحة المصدر فعلاً تمنح مطوري الأجهزة الطرفية سلاحًا

شاهد النسخة الأصلية
MarsBitNews
Tether تفتح مصدر TurboQuant، تخزين مؤقت محلي للذكاء الاصطناعي بأقصى نسبة ضغط تصل إلى 5 أضعاف
Tether AI أعلنت عن إصدار TurboQuant الإنتاجي مفتوح المصدر ودمجه في QVAC SDK 0.12.0. يعتمد TurboQuant على خوارزمية ضغط الذاكرة من Google Research، حيث يمكن لتخزين KV في وقت التشغيل أن يكون قابلاً للضغط حتى 5 مرات، وجودة الإخراج قريبة من غير المضغوط. تتيح هذه التقنية للكمبيوتر المحمول والهاتف والأجهزة الطرفية معالجة محادثات أطول وملفات أكبر بدون الحاجة إلى السحابة. يتضمن هذا الإصدار خط أنابيب كامل للكمية، وموصل إطار الاستدلال، ووثائق تطوير، ويستهدف المطورين والفرق الناشئة على الأجهزة الاستهلاكية والأجهزة الطرفية وشبكات نقطة إلى نقطة.
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت