2026-03-26 05:50:23

مقالة تثير سوق تريليونية، وقطعة الذاكرة التخزينية تنهار...

لم يتوقع أحد أن يبدأ سوق الأسهم الأمريكية هذا الأربعاء، حيث شهد قطاع شرائح الذاكرة التخزينية "لحظة سوداء"، مع تراجع أسهم الشركات الكبرى بشكل جماعي —

حتى إغلاق السوق، انخفضت أسهم شركة ميكرون تكنولوجي بنسبة 4%، وويسترن ديجيتال بنسبة 4.4%، وسيتش بنسبة 5.6%، وساندي بنسبة 6.5%.

المحفز الذي أدى إلى هذه الزلزال البيعي هو خوارزمية الضغط TurboQuant التي أطلقتها جوجل.

كما هو معروف، عندما تعمل النماذج الكبيرة، فإن ذاكرة التخزين المؤقت KV (KV cache) تعتبر بمثابة "وحش ابتلاع الذهب" في عالم الذاكرة.

ولعدم تكرار حساب الرموز السابقة، يحتفظ النموذج بذاكرة "تشغيلية"، ومع زيادة طول الحوار، تتضخم هذه الذاكرة بسرعة مثل كرة الثلج.

أما خوارزمية TurboQuant من جوجل، فهي تقدم حلاً "عنيفاً" للغاية لتقليل الحجم:

أولاً، يتم تدوير المتجهات عالية الأبعاد في ذاكرة التخزين المؤقت KV، ثم يتم استبدالها بنظام إحداثي قطبي لوصفها، مما يقلل استهلاك الذاكرة إلى الصفر مباشرة.

ثم، باستخدام مساحة إضافية تبلغ 1-bit فقط، يتم إدخال "مصحح رياضي" لتصحيح الانحراف المنهجي الناتج عن الضغط بدقة.

سيتم نشر ورقة TurboQuant في مؤتمر ICLR 2026 الذي سيعقد الشهر القادم.

النتيجة مذهلة: بدون أي تدريب إضافي، تمكنت TurboQuant من ضغط الذاكرة إلى 3-bit بشكل جنوني.

وبهذه الطريقة، انخفض استهلاك ذاكرة KV بمقدار 6 مرات، والأهم من ذلك، أن أداء الاستدلال يكاد لا يتأثر.

على H100، مقارنةً بالخط الأساسي 32-bit، زادت سرعة حساب الانتباه باستخدام 4-bit بمقدار 8 مرات. ليس فقط يوفر المساحة، بل يعمل بشكل أسرع أيضاً.

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.