العقود الآجلة
وصول إلى مئات العقود الدائمة
TradFi
الذهب
منصّة واحدة للأصول التقليدية العالمية
الخیارات المتاحة
Hot
تداول خيارات الفانيلا على الطريقة الأوروبية
الحساب الموحد
زيادة كفاءة رأس المال إلى أقصى حد
التداول التجريبي
مقدمة حول تداول العقود الآجلة
استعد لتداول العقود الآجلة
أحداث مستقبلية
"انضم إلى الفعاليات لكسب المكافآت "
التداول التجريبي
استخدم الأموال الافتراضية لتجربة التداول بدون مخاطر
إطلاق
CandyDrop
اجمع الحلوى لتحصل على توزيعات مجانية.
منصة الإطلاق
-التخزين السريع، واربح رموزًا مميزة جديدة محتملة!
HODLer Airdrop
احتفظ بـ GT واحصل على توزيعات مجانية ضخمة مجانًا
منصة الإطلاق
كن من الأوائل في الانضمام إلى مشروع التوكن الكبير القادم
نقاط Alpha
تداول الأصول على السلسلة واكسب التوزيعات المجانية
نقاط العقود الآجلة
اكسب نقاط العقود الآجلة وطالب بمكافآت التوزيع المجاني
رئيس فريق تقنية نموذج Qianwen، لين جون يانغ، يغادر المنصب ويصدر أول مقال طويل بعد رحيله ويتحدث عن Qianwen
عنوان: تبرز سمات أمن أصول الصين، وقد يتوقع سوق الأسهم الصينية استمرارية سوق صاعدة ببطء
المصدر: كواي تكنولوجي
خبر كواي تكنولوجي بتاريخ 27 مارس: في مساء 26 مارس، نشر لين جون يانغ، المسؤول التقني السابق في فريق تشيان وين من علي والذي استقال في بداية هذا الشهر، وهو ما أثار اهتمامًا كبيرًا في مجتمع التكنولوجيا، منشورًا على حسابه في وسائل التواصل الاجتماعي بعنوان: 《From “Reasoning” Thinking to “Agentic” Thinking》(من “التفكير الاستدلالي” إلى “التفكير القائم على وكلاء”)。
في المقال، لم يكشف لين جون يانغ عن موضوع مرتبط بخططه المهنية، بل ركّز على مناقشة تقنية، حيث شرح بالتفصيل فهمه لمسار تطور النماذج الكبيرة وتنبؤه بالمرحلة التالية من تطور الذكاء الاصطناعي.
ذكر لين جون يانغ أن آخر سنتين أعادت تشكيل طريقة تقييم الصناعة للنماذج الكبيرة والتوقعات الجوهرية منها. تُظهر o1 من OpenAI أن “التفكير” يمكن أن يصبح قدرة يتم تدريبها. تلتها DeepSeek-R1 مباشرة، لتثبت أن التعلّم بعد التدريب بأسلوب الاستدلال يمكن إعادة إنتاجه وتوسيعه خارج المختبرات الأصلية. هذه المرحلة حاسمة.
لكن في النصف الأول من عام 2025، بقي تركيز الصناعة أساسًا على “التفكير الاستدلالي” نفسه: كيف نجعل النموذج يفكر أكثر قليلًا أثناء الاستدلال. والآن حان وقت السؤال عن الخطوة التالية. حكمه يتمثل في التفكير بنمط الوكلاء: التفكير من أجل اتخاذ إجراء، وخلال التفاعل مع البيئة، وتحديث الخطة باستمرار بناءً على التغذية الراجعة القادمة من العالم.
وأشار إلى أنه في مطلع 2025، كان لدى فريق تشيان وين طموح كبير: إنشاء نظام موحّد يدمج بين نمط التفكير ونمط التعليمات معًا، ويدعم درجة من جهد الاستدلال القابل للتعديل (على غرار إعدادات استدلال منخفض/متوسط/عالي)، وحتى يمكنه استنتاج كمية الاستدلال المناسبة تلقائيًا وفقًا للموجهات والسياق، ليتقرر النموذج بنفسه متى يجيب مباشرة، ومتى يتأمل قليلًا، ومتى يخصص قدرًا كبيرًا من الحساب لمسائل بالغة الصعوبة حقًا.
ذكر لين جون يانغ أنه من حيث المفهوم، فهذا هو الاتجاه الصحيح. لكن قول “الدمج” أسهل من إنجازه. الصعوبة الحقيقية تكمن في البيانات. عندما يتحدث الناس عن دمج التفكير مع التعليمات، غالبًا ما يفكرون أولًا في توافق النموذج من جهة النموذج، أما المشكلة الأعمق فهي أن توزيع البيانات وأهداف السلوك لهذين النمطين تختلفان اختلافًا واضحًا.
在 محاولة الموازنة بين دمج النموذج وتحسين جودة بيانات ما بعد التدريب وتنوعها، لم تنجح المجموعة في فعل كل شيء على النحو الصحيح؛ والنتيجة غالبًا تكون أداءً متوسطًا في الاتجاهين: يصبح سلوك “التفكير” ضجيجيًا أو زائداً أو غير حاسم بما يكفي، بينما يصبح سلوك “التعليمات” غير واضح وغير موثوق، كما أنه يتكبد تكلفة أعلى من تلك التي يريدها المستخدمون التجاريون فعليًا. وما زالت فكرة القيام بالأمر بشكل منفصل تجذب الاهتمام في التطبيق العملي.
في النصف الثاني من عام 2025، أصدرت نسخة تشيان وين 2507 نسختين مستقلتين: Instruct وThinking. توجد مجموعة لـ 30B وأخرى لـ 235B. أما تفكيره النهائي فكان أن النجاح الحقيقي في الدمج يتطلب طيفًا سلسًا لقوة الاستدلال، بحيث يستطيع النموذج الحكم بنفسه كم من الجهد ينبغي أن ينفقه كي يفكر.
قال لين جون يانغ في المقال: “سلسلة الاستدلال الأطول لا تعني أن النموذج أذكى. كثيرًا ما تعني سلسلة استدلال أطول بدلًا من ذلك أن النموذج يهدر قدرته الحسابية في حسابات عشوائية.” وأضاف أنه ذكر أن فريق تشيان وين أدرك أن الصناعة تتجه من عصر تدريب النماذج إلى عصر تدريب الوكلاء، وتتمثل السمة المميزة لتعريفهم في التفاعل بنظام إغلاق مع العالم الحقيقي.
يعني التفكير بنمط الوكلاء والتفكير الاستدلالي أهدافًا مختلفة للتحسين. فعادةً ما يُقيَّم التفكير الاستدلالي بجودة التفكير الداخلي قبل الإجابة النهائية: هل يستطيع النموذج حل النظريات، وكتابة البراهين، وتوليد كود صحيح، أو اجتياز اختبارات معيارية.
أما تفكير الوكلاء فيركز على: هل يستطيع النموذج تحقيق تقدم مستمر خلال التفاعل مع البيئة؟ وهذا يعني أن السؤال الجوهري يتغير من: “هل يستطيع النموذج أن يفكر لفترة كافية؟” إلى “هل يمكن للنموذج أن يفكر بطريقة تدعم إجراءات فعّالة؟” ويتغير كذلك الهدف الأساسي للتدريب، ليصبح هو النظام بأكمله المكوَّن من النموذج والبيئة.
在 ذلك، تظل بنية النموذج وبيانات التدريب مهمة بالتأكيد، لكن تصميم البيئة، وبنية البنية التحتية للـ rollout، ومدى متانة المقيمين، وكيفية تنسيق عدة Agent معًا—كل ذلك يدخل في دائرة التركيز الأساسية. كما يتغير تعريف “التفكير الجيد”: هو المسار الذي يدعم أفضل إجراء تحت القيود الواقعية، وليس المسار الأطول أو الأكثر بروزًا. وتوقع لين جون يانغ أن التفكير القائم على وكلاء سيصبح الاتجاه السائد.
في السابق، في فجر 4 مارس، نشر لين جون يانغ منشورًا في Moments الودود لوداع علي. وذكر: “سأتولى منصبي. وداعًا، يا qwen العزيز على قلبي.”
في 5 مارس، رد الرئيس التنفيذي لشركة علي بابا، وو يونغ مينغ، على مسألة استقالة لين جون يانغ عبر بريد إلكتروني داخلي، وذكر أن الشركة قررت الموافقة على استقالة زميله لين جون يانغ، مع شكر لين جون يانغ على ما قدمه في منصبه خلال الفترة الماضية. وفي الوقت نفسه، قال أيضًا إن الشركة ستواصل التمسك باستراتيجية النماذج مفتوحة المصدر، مع زيادة جهود الاستثمار في تطوير الذكاء الاصطناعي وجذب المواهب المتميزة باستمرار.
[انتهى المقال] إذا رغبت بالنسخ، يرجى التأكيد على ذكر المصدر: كواي تكنولوجي
المسؤول التحريري: تشيو باي