العقود الآجلة
وصول إلى مئات العقود الدائمة
TradFi
الذهب
منصّة واحدة للأصول التقليدية العالمية
الخیارات المتاحة
Hot
تداول خيارات الفانيلا على الطريقة الأوروبية
الحساب الموحد
زيادة كفاءة رأس المال إلى أقصى حد
التداول التجريبي
مقدمة حول تداول العقود الآجلة
استعد لتداول العقود الآجلة
أحداث مستقبلية
"انضم إلى الفعاليات لكسب المكافآت "
التداول التجريبي
استخدم الأموال الافتراضية لتجربة التداول بدون مخاطر
إطلاق
CandyDrop
اجمع الحلوى لتحصل على توزيعات مجانية.
منصة الإطلاق
-التخزين السريع، واربح رموزًا مميزة جديدة محتملة!
HODLer Airdrop
احتفظ بـ GT واحصل على توزيعات مجانية ضخمة مجانًا
منصة الإطلاق
كن من الأوائل في الانضمام إلى مشروع التوكن الكبير القادم
نقاط Alpha
تداول الأصول على السلسلة واكسب التوزيعات المجانية
نقاط العقود الآجلة
اكسب نقاط العقود الآجلة وطالب بمكافآت التوزيع المجاني
مقالة تثير سوق تريليونية، وقطعة الذاكرة التخزينية تنهار...
لم يتوقع أحد أن يبدأ سوق الأسهم الأمريكية هذا الأربعاء، حيث شهد قطاع شرائح الذاكرة التخزينية "لحظة سوداء"، مع تراجع أسهم الشركات الكبرى بشكل جماعي —
حتى إغلاق السوق، انخفضت أسهم شركة ميكرون تكنولوجي بنسبة 4%، وويسترن ديجيتال بنسبة 4.4%، وسيتش بنسبة 5.6%، وساندي بنسبة 6.5%.
المحفز الذي أدى إلى هذه الزلزال البيعي هو خوارزمية الضغط TurboQuant التي أطلقتها جوجل.
كما هو معروف، عندما تعمل النماذج الكبيرة، فإن ذاكرة التخزين المؤقت KV (KV cache) تعتبر بمثابة "وحش ابتلاع الذهب" في عالم الذاكرة.
ولعدم تكرار حساب الرموز السابقة، يحتفظ النموذج بذاكرة "تشغيلية"، ومع زيادة طول الحوار، تتضخم هذه الذاكرة بسرعة مثل كرة الثلج.
أما خوارزمية TurboQuant من جوجل، فهي تقدم حلاً "عنيفاً" للغاية لتقليل الحجم:
أولاً، يتم تدوير المتجهات عالية الأبعاد في ذاكرة التخزين المؤقت KV، ثم يتم استبدالها بنظام إحداثي قطبي لوصفها، مما يقلل استهلاك الذاكرة إلى الصفر مباشرة.
ثم، باستخدام مساحة إضافية تبلغ 1-bit فقط، يتم إدخال "مصحح رياضي" لتصحيح الانحراف المنهجي الناتج عن الضغط بدقة.
سيتم نشر ورقة TurboQuant في مؤتمر ICLR 2026 الذي سيعقد الشهر القادم.
النتيجة مذهلة: بدون أي تدريب إضافي، تمكنت TurboQuant من ضغط الذاكرة إلى 3-bit بشكل جنوني.
وبهذه الطريقة، انخفض استهلاك ذاكرة KV بمقدار 6 مرات، والأهم من ذلك، أن أداء الاستدلال يكاد لا يتأثر.
على H100، مقارنةً بالخط الأساسي 32-bit، زادت سرعة حساب الانتباه باستخدام 4-bit بمقدار 8 مرات. ليس فقط يوفر المساحة، بل يعمل بشكل أسرع أيضاً.