رئيس فريق تقنية نموذج Qianwen، لين جون يانغ، يغادر المنصب ويصدر أول مقال طويل بعد رحيله ويتحدث عن Qianwen

robot
إنشاء الملخص قيد التقدم

عنوان: تبرز سمات أمن أصول الصين، وقد يتوقع سوق الأسهم الصينية استمرارية سوق صاعدة ببطء

المصدر: كواي تكنولوجي

خبر كواي تكنولوجي بتاريخ 27 مارس: في مساء 26 مارس، نشر لين جون يانغ، المسؤول التقني السابق في فريق تشيان وين من علي والذي استقال في بداية هذا الشهر، وهو ما أثار اهتمامًا كبيرًا في مجتمع التكنولوجيا، منشورًا على حسابه في وسائل التواصل الاجتماعي بعنوان: 《From “Reasoning” Thinking to “Agentic” Thinking》(من “التفكير الاستدلالي” إلى “التفكير القائم على وكلاء”)。

في المقال، لم يكشف لين جون يانغ عن موضوع مرتبط بخططه المهنية، بل ركّز على مناقشة تقنية، حيث شرح بالتفصيل فهمه لمسار تطور النماذج الكبيرة وتنبؤه بالمرحلة التالية من تطور الذكاء الاصطناعي.

ذكر لين جون يانغ أن آخر سنتين أعادت تشكيل طريقة تقييم الصناعة للنماذج الكبيرة والتوقعات الجوهرية منها. تُظهر o1 من OpenAI أن “التفكير” يمكن أن يصبح قدرة يتم تدريبها. تلتها DeepSeek-R1 مباشرة، لتثبت أن التعلّم بعد التدريب بأسلوب الاستدلال يمكن إعادة إنتاجه وتوسيعه خارج المختبرات الأصلية. هذه المرحلة حاسمة.

لكن في النصف الأول من عام 2025، بقي تركيز الصناعة أساسًا على “التفكير الاستدلالي” نفسه: كيف نجعل النموذج يفكر أكثر قليلًا أثناء الاستدلال. والآن حان وقت السؤال عن الخطوة التالية. حكمه يتمثل في التفكير بنمط الوكلاء: التفكير من أجل اتخاذ إجراء، وخلال التفاعل مع البيئة، وتحديث الخطة باستمرار بناءً على التغذية الراجعة القادمة من العالم.

وأشار إلى أنه في مطلع 2025، كان لدى فريق تشيان وين طموح كبير: إنشاء نظام موحّد يدمج بين نمط التفكير ونمط التعليمات معًا، ويدعم درجة من جهد الاستدلال القابل للتعديل (على غرار إعدادات استدلال منخفض/متوسط/عالي)، وحتى يمكنه استنتاج كمية الاستدلال المناسبة تلقائيًا وفقًا للموجهات والسياق، ليتقرر النموذج بنفسه متى يجيب مباشرة، ومتى يتأمل قليلًا، ومتى يخصص قدرًا كبيرًا من الحساب لمسائل بالغة الصعوبة حقًا.

ذكر لين جون يانغ أنه من حيث المفهوم، فهذا هو الاتجاه الصحيح. لكن قول “الدمج” أسهل من إنجازه. الصعوبة الحقيقية تكمن في البيانات. عندما يتحدث الناس عن دمج التفكير مع التعليمات، غالبًا ما يفكرون أولًا في توافق النموذج من جهة النموذج، أما المشكلة الأعمق فهي أن توزيع البيانات وأهداف السلوك لهذين النمطين تختلفان اختلافًا واضحًا.

在 محاولة الموازنة بين دمج النموذج وتحسين جودة بيانات ما بعد التدريب وتنوعها، لم تنجح المجموعة في فعل كل شيء على النحو الصحيح؛ والنتيجة غالبًا تكون أداءً متوسطًا في الاتجاهين: يصبح سلوك “التفكير” ضجيجيًا أو زائداً أو غير حاسم بما يكفي، بينما يصبح سلوك “التعليمات” غير واضح وغير موثوق، كما أنه يتكبد تكلفة أعلى من تلك التي يريدها المستخدمون التجاريون فعليًا. وما زالت فكرة القيام بالأمر بشكل منفصل تجذب الاهتمام في التطبيق العملي.

في النصف الثاني من عام 2025، أصدرت نسخة تشيان وين 2507 نسختين مستقلتين: Instruct وThinking. توجد مجموعة لـ 30B وأخرى لـ 235B. أما تفكيره النهائي فكان أن النجاح الحقيقي في الدمج يتطلب طيفًا سلسًا لقوة الاستدلال، بحيث يستطيع النموذج الحكم بنفسه كم من الجهد ينبغي أن ينفقه كي يفكر.

قال لين جون يانغ في المقال: “سلسلة الاستدلال الأطول لا تعني أن النموذج أذكى. كثيرًا ما تعني سلسلة استدلال أطول بدلًا من ذلك أن النموذج يهدر قدرته الحسابية في حسابات عشوائية.” وأضاف أنه ذكر أن فريق تشيان وين أدرك أن الصناعة تتجه من عصر تدريب النماذج إلى عصر تدريب الوكلاء، وتتمثل السمة المميزة لتعريفهم في التفاعل بنظام إغلاق مع العالم الحقيقي.

يعني التفكير بنمط الوكلاء والتفكير الاستدلالي أهدافًا مختلفة للتحسين. فعادةً ما يُقيَّم التفكير الاستدلالي بجودة التفكير الداخلي قبل الإجابة النهائية: هل يستطيع النموذج حل النظريات، وكتابة البراهين، وتوليد كود صحيح، أو اجتياز اختبارات معيارية.

أما تفكير الوكلاء فيركز على: هل يستطيع النموذج تحقيق تقدم مستمر خلال التفاعل مع البيئة؟ وهذا يعني أن السؤال الجوهري يتغير من: “هل يستطيع النموذج أن يفكر لفترة كافية؟” إلى “هل يمكن للنموذج أن يفكر بطريقة تدعم إجراءات فعّالة؟” ويتغير كذلك الهدف الأساسي للتدريب، ليصبح هو النظام بأكمله المكوَّن من النموذج والبيئة.

在 ذلك، تظل بنية النموذج وبيانات التدريب مهمة بالتأكيد، لكن تصميم البيئة، وبنية البنية التحتية للـ rollout، ومدى متانة المقيمين، وكيفية تنسيق عدة Agent معًا—كل ذلك يدخل في دائرة التركيز الأساسية. كما يتغير تعريف “التفكير الجيد”: هو المسار الذي يدعم أفضل إجراء تحت القيود الواقعية، وليس المسار الأطول أو الأكثر بروزًا. وتوقع لين جون يانغ أن التفكير القائم على وكلاء سيصبح الاتجاه السائد.

في السابق، في فجر 4 مارس، نشر لين جون يانغ منشورًا في Moments الودود لوداع علي. وذكر: “سأتولى منصبي. وداعًا، يا qwen العزيز على قلبي.”

في 5 مارس، رد الرئيس التنفيذي لشركة علي بابا، وو يونغ مينغ، على مسألة استقالة لين جون يانغ عبر بريد إلكتروني داخلي، وذكر أن الشركة قررت الموافقة على استقالة زميله لين جون يانغ، مع شكر لين جون يانغ على ما قدمه في منصبه خلال الفترة الماضية. وفي الوقت نفسه، قال أيضًا إن الشركة ستواصل التمسك باستراتيجية النماذج مفتوحة المصدر، مع زيادة جهود الاستثمار في تطوير الذكاء الاصطناعي وجذب المواهب المتميزة باستمرار.

[انتهى المقال] إذا رغبت بالنسخ، يرجى التأكيد على ذكر المصدر: كواي تكنولوجي

المسؤول التحريري: تشيو باي

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.25Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.26Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.34Kعدد الحائزين:1
    1.57%
  • القيمة السوقية:$2.36Kعدد الحائزين:3
    0.80%
  • القيمة السوقية:$2.25Kعدد الحائزين:1
    0.00%
  • تثبيت