DeepSeek يطلق إطار تسريع الاستدلال مفتوح المصدر DeepSpec، ويطلق DSpark لتحسين سرعة نموذج V4 بنسبة تصل إلى 85%.

robot
إنشاء الملخص قيد التقدم

وفقًا لمراقبة Beating، أصدرت DeepSeek بالتعاون مع جامعة بكين تقريرًا تقنيًا حول إطار تسريع أخذ العينات التخمينية DSpark، وفتحت مكتبة الكود الكاملة DeepSpec كمصدر مفتوح. حاليًا، تم نشر DSpark في خدمة DeepSeek-V4 عبر الإنترنت. مع ضمان عدم فقدان جودة المخرجات، يرفع DSpark سرعة التوليد للمستخدم الواحد في إصدار Flash بنسبة 60% إلى 85%، وفي إصدار Pro بنسبة 57% إلى 78%. يتفوق أداء DSpark على خط الأساس السابق للتنبؤ متعدد الفروع بـ Token واحد (MTP-1)، ويرفع بشكل كبير الإنتاجية الإجمالية للنظام تحت قيود زمن الوصول الصارمة.

سابقًا، كان من الصعب تطبيق أخذ العينات التخمينية متعددة الرموز في بيئة الإنتاج عبر الإنترنت. نموذج المسودة الانحداري بطيء جدًا في التوليد، بينما نموذج المسودة المتوازي، بسبب التنبؤ المستقل لكل موضع، يؤدي إلى معدل قبول منخفض جدًا للنصف الثاني من التسلسلات الطويلة. إذا تم التحقق من المسودات متعددة الرموز بشكل أعمى تحت التزامن العالي، فإن النموذج الكبير سيضيع قدرًا كبيرًا من القوة الحاسوبية للتحقق من الأحرف الخاطئة المقرر رفضها، مما يؤدي إلى انهيار شديد في الإنتاجية الإجمالية للنظام، لذلك يقتصر المجال على التنبؤ بـ Token واحد (MTP-1) عبر الإنترنت.

تغلب DSpark على عنق الزجاجة لتدهور الإنتاجية تحت التزامن العالي. يستخدم DSpark أولاً شبكة DFlash المتوازية الأساسية لتوليد الحالات المخفية، ثم يضيف رأس ماركوف خفيف الوزن جدًا. يقوم رأس ماركوف بحقن الارتباط بين الكلمات المتجاورة بشكل تسلسلي بتكلفة منخفضة جدًا من خلال البحث في الجدول وعملية ضرب مصفوفة واحدة. في الوقت نفسه، يدمج النظام رأس التنبؤ بالثقة وخوارزمية المعايرة اللاحقة. للتكامل المثالي مع جدولة صفرية التكلفة في بيئة الإنتاج ومنع تسرب المعلومات المستقبلية، يستخدم المجدول آلية غير متزامنة، مستفيدًا من التنبؤات التاريخية قبل خطوتين لتحديد طول اقتصاص الكلمات المرشحة ديناميكيًا، مما يمنع تمامًا النموذج الكبير من التحقق من الأحرف الخاطئة عالية المخاطر في النهاية تحت الحمل الثقيل.

بالإضافة إلى DSpark، تدعم مكتبة الكود DeepSpec التي أصدرتها DeepSeek كمصدر مفتوح هذه المرة نماذج مفتوحة المصدر مثل Qwen3 و Gemma. توفر DeepSpec سلسلة أدوات Python كاملة بدءًا من تنزيل النصوص التوجيهية، وإعادة بناء ذاكرة التخزين المؤقت للنموذج الكبير، وتدريب نموذج المسودة، وحتى التقييم المعياري. يمكن للمطورين استخدام البرامج النصية مفتوحة المصدر مباشرة لتخصيص ونشر وحدات التسريع المخصصة لنماذج مفتوحة المصدر المختلفة محليًا.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت