يانغ تشي لين في مؤتمر GTC 2026: الكشف عن مسار تقنية Kimi، والتحدث عن "عنق الزجاجة في التوسع"

robot
إنشاء الملخص قيد التقدم

سينا科技 نيوز، 18 مارس، صباحًا، أعلنت أن مؤسس “كيمي”، يانغ زيلين، شارك في مؤتمر NVIDIA GTC 2026، قائلاً إنه من أجل دفع حدود الذكاء في النماذج الكبيرة، يجب إعادة بناء الأسس الأساسية مثل المحسنات، وآليات الانتباه، والروابط المتبقية.

بعد إصدار نموذج Kimi K2.5 رسميًا في نهاية يناير من هذا العام، كشف يانغ زيلين لأول مرة عن خارطة الطريق التقنية وراء هذا النموذج خلال خطابه. لخص تطور كيمي في ثلاثة أبعاد: كفاءة الرموز، السياق الطويل، وتجمع الوكلاء (Agent Swarms). يرى يانغ أن التوسع الحالي لم يعد مجرد تراكم الموارد، بل يتطلب تحسين الكفاءة الحسابية، والذاكرة الطويلة الأمد، والتعاون الآلي، مع البحث عن تأثيرات حجمية في هذه الأبعاد الثلاثة. إذا تم ضرب هذه المكاسب التقنية معًا، فإن النموذج سيظهر مستوى ذكاء يفوق الوضع الحالي بكثير.

التحول التكنولوجي هو جوهر هذا الخطاب. اقترح يانغ أن العديد من المعايير التقنية المستخدمة حاليًا في الصناعة هي في جوهرها نتاج قبل حوالي ثمانية أو تسعة أعوام، وتبدأ تدريجيًا في أن تصبح عائقًا أمام التوسع.

منذ عام 2014، يُعتبر محسن Adam المعيار الصناعي، لكن في التدريب على نطاق واسع جدًا، أصبح البحث عن بدائل أكثر كفاءة في الرموز اتجاهًا. أثبت فريق كيمي في تجاربه أن محسن Muon لديه إمكانات ملحوظة في تحسين كفاءة الرموز، لكن عند توسيعه ليشمل نموذج K2 الذي يضم تريليونات من المعلمات، واجهوا مشكلة استقرار بسبب انفجار القيم Logits الذي أدى إلى انحراف النموذج. لذلك، طور الفريق محسن MuonClip وفتح مصدره، باستخدام تكرار Newton-Schulz ودمجه مع آلية QK-Clip، مما حل مشكلة انفجار Logits بشكل كامل، وحقق ضعف كفاءة الحساب مقارنة بـ AdamW التقليدي.

بالنسبة لآلية الانتباه الكاملة التي ظهرت في 2017، عرض يانغ زيلين نموذج Kimi Linear المبني على بنية KDA. وهو نوع من بنية الانتباه الخطي المختلطة، تتحدى المبدأ القائل بأنه يجب استخدام الانتباه الكامل في كل طبقة، من خلال تحسين إدارة التخزين التكراري، مما أدى إلى زيادة سرعة فك التشفير بمقدار 5 إلى 6 مرات في سياقات طويلة جدًا تصل إلى 128 ألف أو حتى مليون رمز، مع الحفاظ على أداء ممتاز في سيناريوهات مختلفة الطول.

بالإضافة إلى ذلك، فيما يخص الروابط المتبقية التي تعود لعقد من الزمن، أدخلت كيمي خطة Attention Residuals، التي استبدلت الجمع الثابت التقليدي بآلية انتباه Softmax على مخرجات الطبقات السابقة، مما حل مشكلة زيادة الحالة المخفية بشكل غير محدود مع العمق، وسمح لكل طبقة بجمع المعلومات بشكل انتقائي حسب المحتوى المدخل. أثارت هذه المبادرة تفكير مؤسس OpenAI المشارك، كارباتي، الذي قال إن فهمنا لورقة “Attention is All You Need” لا يزال غير كافٍ. كما علّق إيلون ماسك، مؤسس xAI، أن عمل كيمي كان مثيرًا للإعجاب.

في مجال البحث متعدد الوسائط، شارك يانغ ملاحظة مهمة: أن التعلم المعزز للرؤية (Vision RL) في التدريب المشترك بين الصور والنصوص يمكن أن يعزز بشكل ملحوظ أداء النصوص. أظهرت تجارب الإزالة أن النموذج بعد تدريب Vision RL حقق زيادة قدرها حوالي 2.1% في اختبارات معيارية مثل MMLU-Pro وGPQA-Diamond، مما يشير إلى أن تعزيز الاستنتاج المكاني والمنطق البصري يمكن أن يتحول إلى قدرات معرفية عامة أعمق.

وفي الختام، ناقش يانغ زيلين توسيع تجمع الوكلاء. يرى أن الشكل المستقبلي للذكاء سيتطور من وكيل واحد إلى تجمع ديناميكي يتم توليده بشكل تلقائي. أدخلت Kimi K2.5 آلية Orchestrator، التي يمكنها تقسيم المهام الطويلة والمعقدة إلى عشرات الوكلاء الفرعيين المعالجين بشكل متزامن. ولمنع الاعتماد الأحادي الذي قد يؤدي إلى انهيار تسلسلي، صمم الفريق وظيفة مكافأة جديدة للتعلم المعزز التوازي، تحفز النموذج على تعلم تقسيم المهام وتنفيذها بشكل متزامن حقًا.

وفي ختام ملخصه، تحدث يانغ عن تحول في نمط البحث في الذكاء الاصطناعي. ذكر أن الأبحاث قبل عشر سنوات كانت تركز أكثر على نشر الأفكار الجديدة، لكن محدودية الموارد الحاسوبية كانت تعيق اختبارها عبر تجارب بأحجام مختلفة. الآن، مع توفر الموارد و"سلم التوسع"، يمكن للباحثين إجراء تجارب منهجية على نطاق واسع، مما يؤدي إلى استنتاجات أكثر ثقة وموثوقية. هذا هو السبب في أن كيمي استطاع أن يستخلص ابتكارات جديدة من تقنيات قد تبدو قديمة، وسيواصل الالتزام بمسار المصدر المفتوح، من خلال تقديم MuonClip وKimi Linear وAttention Residuals وغيرها من الابتكارات الأساسية للمجتمع المفتوح، لبناء نماذج أقوى ودفع تكنولوجيا الذكاء الاصطناعي نحو الانتشار الواسع. (مكتوب بواسطة مينغ)

KDA‎-3.42%
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.31Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.31Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.33Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.33Kعدد الحائزين:1
    0.00%
  • تثبيت