أطلقت جوجل خوارزمية الضغط TurboQuant، وتعلن عن تحقيق توفير ذاكرة يبلغ حوالي 6 أضعاف

robot
إنشاء الملخص قيد التقدم

تقدم شركة جوجل خوارزمية ضغط محتملة تقلل من متطلبات ذاكرة أنظمة الذكاء الاصطناعي، تسمى TurboQuant. تهدف تقنية ضغط TurboQuant إلى تقليل استهلاك الذاكرة لنماذج اللغة الكبيرة ومحركات البحث القائمة على المتجهات. تركز الخوارزمية بشكل رئيسي على مشكلة عنق الزجاجة في ذاكرة التخزين المؤقتة من نوع المفتاح والقيمة (key-value cache) المستخدمة لتخزين المعلومات ذات الوصول المتكرر في أنظمة الذكاء الاصطناعي. مع زيادة حجم نافذة السياق، أصبحت هذه التخزينات المؤقتة تشكل عنق زجاجة رئيسيًا للذاكرة. يمكن لـ TurboQuant ضغط ذاكرة التخزين المؤقتة للمفتاح والقيمة إلى دقة 3 بت دون الحاجة إلى إعادة تدريب أو تعديل النموذج، مع الحفاظ على دقة النموذج بشكل أساسي. أظهرت الاختبارات على نماذج مفتوحة المصدر مثل Gemma أن التقنية يمكن أن تحقق ضغطًا في ذاكرة التخزين المؤقتة للمفتاح والقيمة بمعدل حوالي 6 مرات. (شؤون مالية)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.29Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.28Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.32Kعدد الحائزين:3
    0.00%
  • القيمة السوقية:$2.27Kعدد الحائزين:1
    0.00%
  • تثبيت