DeepSeek يطلق ورقة بحثية جديدة

K-LinePoet · 2026-03-28T05:04:57+00:00

فريق DeepSeek بالتعاون مع جامعة بكين وجامعة Tsinghua أصدر ورقة بحثية جديدة تناقش تأثير سرعة الاستنتاج على تطبيقات النماذج الكبيرة، واقترحوا نظام DualPath، من خلال تحسين آلية KV-Cache، مما أدى إلى تحسين كبير في أداء الاستنتاج غير المتصل والمتصل على حد سواء. هذا يمثل تحولًا في النماذج الكبيرة نحو أنظمة ذكية تدعم التفاعل متعدد الجولات.

K-LinePoet

2026-03-28 05:04:57

إنشاء الملخص قيد التقدم

في ظل ترقب الصناعة لنموذج DeepSeek V4 الرائد من الجيل الجديد، أطلق فريق DeepSeek بهدوء ورقة أكاديمية جديدة.
تُعد هذه الورقة نتاج تعاون بين DeepSeek وجامعتين بكين وتسينغوا، حيث تم توجيه البحث نحو حلقة حاسمة تحدد التطبيق الفعلي للنماذج الكبيرة - سرعة الاستدلال، لتوفير حل نظام أساسي فعال لوكلاء الذكاء الاصطناعي المتزايد التعقيد.
على وجه التحديد، تقدم الورقة الجديدة نظام استدلال مبتكر يُدعى DualPath، تم تصميمه خصيصًا لتحسين أداء استدلال النماذج الكبيرة (LLM) تحت أعباء عمل الوكلاء.
من خلال إدخال آلية “قراءة KV-Cache ذات المسارين” (تشبه ذاكرة التخزين المؤقت)، تم إعادة توزيع أحمال الشبكة التخزينية، مما أدى إلى زيادة إنتاجية الاستدلال غير المتصل إلى 1.87 مرة، وزيادة عدد تشغيل الوكلاء في الخدمة المتصلة في الثانية بمعدل 1.96 مرة.
تذكر الورقة في قسم المقدمة أن النماذج الكبيرة تتطور بسرعة من روبوتات المحادثة ذات الجولة الواحدة ونماذج الاستدلال المستقلة، إلى أنظمة وكلاء - قادرة على التخطيط الذاتي، واستدعاء الأدوات، وحل المهام العملية من خلال تفاعلات متعددة الجولات.
تدفع هذه التحولات في نماذج الاستخدام إلى تغييرات كبيرة في أعباء عمل استدلال النماذج الكبيرة: من التفاعل التقليدي بين الإنسان والنموذج الكبير، إلى التفاعل بين الإنسان والنموذج الكبير والبيئة، حيث يمكن أن تصل جولات التفاعل إلى عدة عشرات أو حتى مئات الجولات.
(الاقتصاد الأول)

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.