DeepSeek يطلق ورقة بحثية جديدة

robot
إنشاء الملخص قيد التقدم

في ظل ترقب الصناعة لنموذج DeepSeek V4 الرائد من الجيل الجديد، أطلق فريق DeepSeek بهدوء ورقة أكاديمية جديدة.
تُعد هذه الورقة نتاج تعاون بين DeepSeek وجامعتين بكين وتسينغوا، حيث تم توجيه البحث نحو حلقة حاسمة تحدد التطبيق الفعلي للنماذج الكبيرة - سرعة الاستدلال، لتوفير حل نظام أساسي فعال لوكلاء الذكاء الاصطناعي المتزايد التعقيد.
على وجه التحديد، تقدم الورقة الجديدة نظام استدلال مبتكر يُدعى DualPath، تم تصميمه خصيصًا لتحسين أداء استدلال النماذج الكبيرة (LLM) تحت أعباء عمل الوكلاء.
من خلال إدخال آلية “قراءة KV-Cache ذات المسارين” (تشبه ذاكرة التخزين المؤقت)، تم إعادة توزيع أحمال الشبكة التخزينية، مما أدى إلى زيادة إنتاجية الاستدلال غير المتصل إلى 1.87 مرة، وزيادة عدد تشغيل الوكلاء في الخدمة المتصلة في الثانية بمعدل 1.96 مرة.
تذكر الورقة في قسم المقدمة أن النماذج الكبيرة تتطور بسرعة من روبوتات المحادثة ذات الجولة الواحدة ونماذج الاستدلال المستقلة، إلى أنظمة وكلاء - قادرة على التخطيط الذاتي، واستدعاء الأدوات، وحل المهام العملية من خلال تفاعلات متعددة الجولات.
تدفع هذه التحولات في نماذج الاستخدام إلى تغييرات كبيرة في أعباء عمل استدلال النماذج الكبيرة: من التفاعل التقليدي بين الإنسان والنموذج الكبير، إلى التفاعل بين الإنسان والنموذج الكبير والبيئة، حيث يمكن أن تصل جولات التفاعل إلى عدة عشرات أو حتى مئات الجولات.
(الاقتصاد الأول)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.26Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.26Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.26Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.35Kعدد الحائزين:3
    0.52%
  • القيمة السوقية:$2.32Kعدد الحائزين:2
    0.45%
  • تثبيت