يانغ زيلين، تشانغ بينغ، لو فو لي يتحدثون معًا: بعد ارتفاع سعر الكركند، إلى أين تتجه التحولات في الذكاء الاصطناعي؟

2026-03-27 10:39:31

أخبار الحوت الأزرق 27 مارس (المراسل: تشو جونشي) في 27 مارس، في منتدى الذكاء الاصطناعي المفتوح البارز في المؤتمر السنوي لمنتدى تشونغوانتسون 2026، كانت هناك حلقة نقاش مثيرة حول “OpenClaw والذكاء الاصطناعي المفتوح”. مؤسس “وجه القمر” يانغ تشي لين شارك كمنسق، وكان من بين الضيوف الرئيسيين: زانغ بينغ، الرئيس التنفيذي لشركة Zhipu، شيا لي شيو، المؤسس المشارك والرئيس التنفيذي لشركة Wuwen Xinqiong، لوه فولي، مسؤولة نموذج MiMo من شركة Xiaomi، والأستاذ المساعد في جامعة هونغ كونغ، هوانغ تشاو.

الخمسة ضيوف الذين كانوا على المنصة يمثلون طبقات نماذج الذكاء الاصطناعي والبنية التحتية في سلسلة صناعة الذكاء الاصطناعي. من بين هؤلاء، تحمل كل من “وجه القمر” و"Zhipu" جينات واضحة من جامعة تسينغhua. يانغ تشي لين تخرج من جامعة تسينغhua، وزانغ بينغ درس من البكالوريوس إلى الدكتوراه في تسينغhua، وشيا لي شيو تأتي أيضًا من قسم الهندسة الإلكترونية في تسينغhua. أما لوه فولي فقد تخرجت من جامعة بكين، ثم عملت في معهد علي بابا دابو، ثم انضمت إلى DeepSeek كأبحاث في التعلم العميق، حيث شاركت في تطوير نماذج مثل DeepSeek-V2.

بالنسبة لمشروع Agent الشهير OpenClaw، وصفه زانغ بينغ بأنه “سقالة”، حيث يبني إطارًا قويًا ومرنًا وسهل الاستخدام فوق النماذج الأساسية، مما يسمح للناس العاديين باستخدام قدرات النماذج الرائدة بسهولة، خاصة في مجالات البرمجة والذكاء الاصطناعي.

ترى لوه فولي أنه من منظور نموذج القاعدة الكبيرة، فإن OpenClaw من جهة قد رفع الحد الأقصى لقدرات النموذج، مما جعل العديد من النماذج المحلية تؤدي بشكل قريب من النماذج الرائدة في معظم المهام؛ ومن جهة أخرى، من خلال نظام harness، ونظام skills، وما إلى ذلك، يضمن الحد الأدنى من إنجاز المهام واستقرارها. من منظور أوسع، أشعل OpenClaw أيضًا مساحة تخيلية جديدة في طبقة الوكلاء خارج النماذج الكبيرة.

في ظل هذه الموجة من حماس OpenClaw، أصبحت شركات النماذج الكبيرة مثل “وجه القمر” و"Zhipu" من المستفيدين. يعتبر تنفيذ OpenClaw محليًا تحديًا مرتفعًا، وسرعة استهلاك التوكن أثناء التشغيل يمكن أن تؤدي إلى تكاليف باهظة. وهذا دفع العديد من المستخدمين إلى النظر في خيار آخر، وهو خطط “التنفيذ بنقرة واحدة” التي تقدمها شركات السحاب المحلية وشركات النماذج.

في 18 فبراير، أطلقت “وجه القمر” منتج OpenClaw السحابي Kimi Claw، الذي يدعم تنفيذ OpenClaw مباشرة داخل Kimi. يجمع بين قدرات الوكيل لـ OpenClaw والبنية التحتية السحابية واستدعاء المهارات الفوري، ويمكنه أيضًا الاستفادة من قدرات البحث المتقدمة في Kimi واستخراج البيانات، وقد تم تكوين نموذج K2.5 Thinking بشكل تلقائي.

في 10 مارس، أطلقت Zhipu أيضًا “الإصدار المحلي من OpenClaw القابل للتثبيت بنقرة واحدة” AutoClaw (أو لونغ). وفي منتصف هذا الشهر، قدمت Zhipu نموذج GLM-5-Turbo، الذي تم تحسينه بشكل عميق لمشاهد الروبيان باستخدام OpenClaw، مع التركيز على الاحتياجات الأساسية لمهام الروبيان منذ مرحلة التدريب، مما يعزز القدرات الأساسية مثل استدعاء الأدوات، والامتثال للتعليمات، والمهام الزمنية والمستمرة، والتنفيذ على سلاسل طويلة.

تتبع شركات تصنيع الهواتف مثل Xiaomi بسرعة التطورات. في 6 مارس، بدأت Xiaomi اختبارًا مغلقًا محدودًا لعميل Agent المحمول “Xiaomi miclaw”، وهو أول تطبيق AI Agent من نوعه في الصين على الهواتف المحمولة. يعتمد هذا الوكيل على نموذج Xiaomi MiMo، والهدف الرئيسي هو تنفيذ قدرات النموذج الكبير على مستوى نظام الهاتف، وتنفيذ عمليات على مستوى النظام بشكل مستقل.

في ختام المنتدى، طرح يانغ تشي لين سؤالاً مفتوحًا: إذا كان عليك استخدام كلمة واحدة لوصف اتجاهات تطور النماذج الكبيرة والتوقعات الخاصة بك في الأشهر الـ 12 القادمة. ضحك هوانغ تشاو، قائلاً إن 12 شهرًا في مجال الذكاء الاصطناعي تبدو بعيدة جدًا. أجاب يانغ تشي لين بأنه قد تم تحديد السؤال في الأصل بـ “خمس سنوات”، لكنه اختصره إلى فترة زمنية أكثر واقعية.

أشارت لوه فولي إلى أن أهم شيء في رحلة AGI في العام المقبل سيكون التطور الذاتي. ترى أنه في ظل نموذج الحوار السابق، لم يتم إطلاق الحد الأقصى لقدرة النموذج المدرب بشكل كامل، ولكن مع تطور إطار الوكلاء، يتم تنشيط هذا الحد تدريجياً. من وجهة نظرها، فإن معنى التطور الذاتي لا يكمن في استبدال الإنتاجية البشرية، بل في استكشاف أشياء غير موجودة في هذا العالم مثل أفضل العلماء.

عاد زانغ بينغ إلى الاعتبارات الواقعية، مشيرًا إلى أن القدرة الحاسوبية لا تزال أكبر مشكلة تواجههم. وأشار إلى أنه على الرغم من أن إطار الوكلاء قد منح الكثير من الناس إبداعًا جيدًا وزيادة في الكفاءة بمعدل عشرة أضعاف، فإن الشرط الأساسي هو أن يكون بإمكانهم استخدامه. مع تحول الصناعة إلى مرحلة الاستدلال، يظهر الطلب بمعدل عشرة أضعاف أو مئات الأضعاف، ولا يزال هناك الكثير من الطلب غير الملبى، ويجب أن نعمل معًا لإيجاد حلول.

فيما يلي نص الحوار الكامل، تم تعديله بواسطة أخبار الحوت الأزرق مع الحفاظ على المعنى الأصلي:

يانغ تشي لين

ما هو الشيء الأكثر إبداعًا أو انطباعًا بالنسبة لكم عندما تستخدمون OpenClaw أو منتجات مشابهة في حياتكم اليومية؟ من منظور تقني، كيف تنظرون إلى تقدم OpenClaw والوكلاء المرتبطين به اليوم؟

زانغ بينغ

بالفعل، بدأت اللعب بـ OpenClaw منذ فترة طويلة، ولم يكن يُطلق عليه OpenClaw في ذلك الوقت، بل كان يُسمى Clawdbot، وكنت أعبث بهذه الأمور وأقوم بها بنفسي. حيث أنني أيضًا من خلفية برمجية، فإن تجربتي مع هذه الأشياء لها بعض الأبعاد الخاصة بها. أعتقد أن أكبر نقطة تحول يمكن أن يجلبها هذا الأمر للجميع، أو ما يمكن أن يطلق عليه نقطة جديدة، هو أن هذا الأمر لم يعد براءة اختراع للمبرمجين أو المتخصصين، بل يمكن للناس العاديين استخدام قدرات هذه النماذج الرائدة بسهولة، خاصة في مجالات البرمجة والوكلاء.

لذلك حتى الآن، ربما خلال عملية التواصل مع الجميع، أميل أكثر إلى وصف OpenClaw بأنه “سقالة”. إنها توفر إمكانية، حيث يتم بناء إطار قوي ومريح ومرن على أساس النماذج. يمكن للناس استخدامها كما يريدون لاستكشاف العديد من الأشياء الجديدة التي تقدمها النماذج الأساسية. كانت أفكاري السابقة مقيدة بسبب عدم قدرتي على كتابة الشيفرة، أو عدم امتلاكي مهارات معينة. لكن اليوم، يمكن أخيرًا إنجاز ذلك من خلال تواصل بسيط. لذلك، هذا الأمر كان له تأثير كبير بالنسبة لي، أو دعني أقول إنه جعلني أعيد التفكير في هذا الأمر.

شيا لي شيو

في الواقع، عندما بدأت استخدام OpenClaw، لم أكن معتادة عليه، لأنني كنت معتادة على هذا النوع من التواصل مع النماذج الكبيرة، ووجدت أن OpenClaw يبدو وكأنه يستجيب ببطء. ولكن بعد ذلك أدركت مشكلة كبيرة، وهي أنه يختلف كثيرًا عن الروبوتات الحوارية السابقة، بل يجب أن يكون “إنسانًا” يمكنه مساعدتي في إنجاز مهام كبيرة. لذلك، عندما بدأت أقدم له مهام أكثر تعقيدًا، وجدت أنه يمكنه القيام بذلك بشكل جيد.

هذه المسألة كانت لها تأثير كبير بالنسبة لي، وهو أن النموذج قد تطور من مجرد الدردشة وفقًا للتوكن إلى أن يصبح وكيلًا، أو يصبح “روبيانًا”، يمكنه مساعدتك في إنجاز المهام. لقد زاد ذلك من مساحة خيالنا بشأن الذكاء الاصطناعي بشكل كبير. ولكن في الوقت نفسه، زادت متطلبات النظام بالكامل. هذا هو السبب في أنني شعرت في البداية أن OpenClaw كان يبطئ الأمور.

لذا، من وجهة نظر مزود للبنية التحتية مثلنا، أرى أن Claw قد جلب المزيد من الفرص والتحديات للنظام البيئي الكبير في مجال الذكاء الاصطناعي. لأن جميع الموارد المتاحة لنا حاليًا غير كافية لدعم هذا العصر المتسارع. على سبيل المثال، بالنسبة لشركتنا، بدأنا في نهاية يناير، تقريبًا كل أسبوعين تضاعف حجم التوكن لدينا، والآن تضاعف عشرة أضعاف. آخر مرة شعرت بهذا النوع من السرعة كانت عندما كانت شبكة 3G.

لذا، أشعر أن استخدام التوكن الآن يشبه إلى حد كبير عندما كان لدينا 100 ميجابايت من بيانات الهاتف المحمول في الشهر. في هذه الحالة، يجب أن يتم تحسين جميع مواردنا بشكل أفضل. يجب أن نجعل كل فرد، ليس فقط في مجال الذكاء الاصطناعي، بل في المجتمع بأسره، يستطيع استخدام OpenClaw، واستخدام تلك القدرات الذكية. لذا، من وجهة نظر مزود للبنية التحتية، أشعر بإثارة كبيرة وتأثير كبير تجاه هذا العصر. وأعتقد أن هناك الكثير من المساحات للتطوير، والتي يجب علينا الاستكشاف والتجربة.

لوه فولي

أرى أن OpenClaw هو حدث ثوري ومخرب في إطار الوكلاء. على الرغم من أنني أعلم أن جميع من حولي ممن يقومون ببرمجة عميقة، قد يفضلون في البداية استخدام Claude Code. ولكنني أعتقد أن فقط أولئك الذين جربوا OpenClaw سيشعرون بشكل فريد بقيمة هذا الإطار. لديه العديد من التصاميم في إطار الوكلاء التي تتفوق على Claude Code. بما في ذلك التحديثات الأخيرة لـ Claude Code، التي تقترب من OpenClaw.

عندما أستخدم OpenClaw، أشعر أن هذا الإطار يوسع خيالي في أي وقت وأي مكان. في البداية، كان بإمكاني فقط توسيع إبداعي باستخدام Claude Code على سطح المكتب، ولكن مع OpenClaw يمكنني توسيع إبداعي في أي مكان.

لقد اكتشفت أن القيمة الأساسية التي يجلبها OpenClaw هي اثنتين. أولاً، أنه مفتوح المصدر. فتوفير شفرة مفتوحة هو شرط أساسي مهم جدًا للمجتمع للمشاركة العميقة، والتركيز على التحسين، والاستثمار في إطار الوكلاء. أعتبر أن القيمة الكبيرة لإطارات الوكلاء مثل OpenClaw وClaude Code تكمن في رفع الحد الأقصى للنماذج المحلية التي قد لا تكون قريبة جدًا من النماذج المغلقة، ولكنها لا تزال في مسار النماذج شبه المغلقة. في معظم السيناريوهات، يمكننا أن نرى أن مستوى إنجاز المهام قد اقترب جدًا من أحدث نماذج Claude، وفي الوقت نفسه، يتم ضمان الحد الأدنى بشكل جيد. لأنه يمكن أن يعتمد على نظام harness، أو نظام skills، أو تصميمات متعددة أخرى لضمان دقة وإنجاز المهام.

لذا أعتقد أن OpenClaw، من منظور نموذج قاعدة كبيرة، يضمن الحد الأدنى للنموذج الأساسي، ويرتفع بالحد الأقصى له.

بالإضافة إلى ذلك، أعتقد أن OpenClaw جلب قيمة أكبر للمجتمع من خلال إشعال اكتشاف أن هناك طبقة أكثر أهمية من الوكلاء خارج النماذج الكبيرة. هناك الكثير من الخيال والمساحة يمكن العمل عليها. هذا ما يجعلني أرى أن المزيد من الأشخاص خارج الباحثين يشاركون في هذا التحول إلى AGI. كما يوجد المزيد من الأشخاص الذين يستفيدون من إطار الوكيل الأقوى، وharness، وما إلى ذلك، لاستبدال بعض أعمالهم، وإطلاق أوقاتهم للقيام بأشياء أكثر إبداعًا.

يانغ تشي لين

مؤخراً، أصدرت Zhipu أيضًا نموذج GLM-5-Turbo الجديد، وأفهم أنه يعزز قدرات الوكيل بشكل كبير. لذا، هل يمكنك تقديم لمحة عن هذا النموذج الجديد وما يميزه عن النماذج الأخرى، كما لاحظنا أن هناك استراتيجية لزيادة الأسعار، ماذا تعكس من إشارات السوق؟

زانغ بينغ

قبل يومين، قمنا بتحديث سريع. بالطبع، هذا جزء من خارطة طريق تطورنا، وقد أطلقناها مبكرًا بعض الشيء. الهدف الأساسي من هذا الأمر هو الانتقال من المحادثات البسيطة إلى العمل. وهذا أيضًا ما اتفق عليه الجميع، وهو أن OpenClaw جعل الجميع يدرك أن النماذج الكبيرة لم تعد فقط قادرة على الدردشة، بل يمكنها حقًا مساعدتي في العمل.

لكن القدرة المطلوبة خلف هذا العمل عالية جدًا. يحتاج إلى تخطيط طويل الأمد للمهام، والمحاولة المتكررة، وضغط السياق الخاص به، وتصحيح الأخطاء، وما إلى ذلك، وقد تتطلب معالجة متعددة الوسائط. لذلك، فإن متطلبات القدرة للنموذج نفسه تختلف عن النماذج العامة أو الشاملة التقليدية المستخدمة في الروبوتات الحوارية. لذا، تمت تعزيز GLM-5-Turbo في هذا المجال، على سبيل المثال، كيف يمكنه العمل على مهام طويلة على مدار الساعة، وكيف يمكنه القيام بذلك بشكل مستمر.

كما تحدث الجميع أيضًا عن مسألة استهلاك التوكن. النماذج الذكية التي تتعامل مع مهام معقدة قد تستهلك كمية هائلة من التوكن. قد لا يدرك الأشخاص العاديون ذلك، لكنهم سيرون فقط الأموال تتناقص في فواتيرهم. لذلك، قمنا أيضًا بإجراء بعض التحسينات، وعند مواجهة مهام معقدة، قد تستخدم كفاءة توكن أعلى لإنجاز هذه الأمور. لذا، قمنا بتحسين عدة جوانب. ولكن في جوهرها، تظل هيكلية النموذج نموذجًا عامًا للتعاون متعدد المهام، مع بعض التعزيزات في القدرات.

أما بالنسبة لزيادة الأسعار، فيمكنني شرح ذلك بسلاسة. نحن الآن لا نسأل ببساطة سؤالًا، بل وراء ذلك سلسلة طويلة من التفكير. بما في ذلك العديد من المهام، عن طريق كتابة الشيفرة للتفاعل مع تلك البنية التحتية، يجب علينا تصحيح الأخطاء، وتصحيح الأخطاء بشكل مستمر. في الواقع، هذا الاستهلاك ضخم. قد تتطلب إكمال مهمة ما كمية من التوكن تصل إلى عشرة أضعاف أو مائة ضعف ما كان مطلوبًا للإجابة على سؤال بسيط. لذا، يجب أن تكون هناك زيادة في التكاليف، كما أن النموذج أصبح أكبر، وبالتالي فإن تكاليف الاستدلال ترتفع أيضًا، لذا نعيد ذلك إلى قيمة تجارية طبيعية.

لأن الاعتماد على المنافسة السعرية المنخفضة على المدى الطويل ليس مفيدًا لتطور الصناعة بأكملها. هذه هي إحدى اعتباراتنا، مما يتيح لنا الاستمرار في مسار تجاري صحي، مما يمكننا من تحسين قدرات النموذج، وتقديم خدمات أفضل في مجال التوكن.

يانغ تشي لين

الآن مع ظهور النماذج المفتوحة المصدر وقوة الاستدلال، أعتقد أنه بدأ يتشكل نظام بيئي، حيث يمكن أن تقدم أنواع مختلفة من النماذج المفتوحة قيمة أكبر للمستخدمين على أنواع مختلفة من قوة الاستدلال. مع عروض أسعار كمية التوكن، قد نبدأ تدريجياً في الانتقال من عصر التدريب إلى عصر الاستدلال. لذا، أود أن أسأل، من منظور البنية التحتية، ماذا يعني عصر الاستدلال لشركة Wuwen؟

شيا لي شيو

كوننا مزود بنية تحتية نشأ في عصر الذكاء الاصطناعي، نحن نعمل حاليًا مع Kimi وZhipu وMiMo، مما يتيح لهم استخدام مصنع التوكن لدينا بشكل أكثر كفاءة. لذا، نحن دائمًا نفكر في شيء، وهو ما هي البنية التحتية التي يحتاجها عصر AGI؟ كيف يمكننا تحقيق ذلك خطوة بخطوة؟

نحن أيضًا مستعدون تمامًا، ورأينا المشكلات التي تحتاج إلى حل على المدى القصير والمتوسط والطويل.

المشكلة الحالية هي الزيادة الكبيرة في كمية التوكن. لقد أدت إلى الحاجة إلى تحسين أكبر في كفاءة نظامنا. بما في ذلك ارتفاع الأسعار، هو أيضًا وسيلة لحل هذه الحاجة. نحن دائمًا نقوم بالتخطيط من خلال الربط بين البرمجيات والأجهزة. بما في ذلك الاتصال بكل أنواع شرائح الحوسبة المتاحة. ربطنا عشرات الأنواع من الشرائح ومجموعات الحوسبة المختلفة في البلاد، مما يساعد على حل مشكلة نقص موارد الحوسبة في نظام الذكاء الاصطناعي. لأنه عندما تكون الموارد غير كافية، فإن أفضل طريقة هي استخدام جميع الموارد المتاحة أولاً. وثانيًا، التأكد من أن كل وحدة حوسبة تعمل بكفاءة قصوى.

لذا، في هذا العصر، ما نحتاج إلى حله هو كيفية إنشاء مصنع توكن أكثر كفاءة. قمنا بإجراء العديد من التحسينات، بما في ذلك تحسين التوافق بين النماذج والأجهزة المختلفة، بما في ذلك ذاكرة الفيديو والتقنيات المختلفة. كما نبحث في إمكانية إجراء تفاعلات كيميائية أعمق بين الهياكل الجديدة للنماذج وبنية الأجهزة. لحل مشكلة الكفاءة الحالية، نحن فقط أنشأنا مصنع توكن موحد.

لكن بالنسبة لعصر الوكلاء، نعتقد أن هذا غير كافٍ. كما ذُكر سابقًا، فإن الوكلاء يشبهون البشر، حيث يمكننا تكليفهم بمهمة. أنا مؤمن بشدة أن العديد من بنى الحوسبة السحابية الحالية مصممة لخدمة برنامج أو مهندس بشري، وليست مصممة للذكاء الاصطناعي. هذا يشبه إلى حد ما تصميم بنية تحتية مع واجهة مصممة للمهندسين البشر، ثم إضافة طبقة أخرى لتوصيل الوكلاء؛ هذه الطريقة في الواقع تقيد قدرة الوكلاء.

نحن نسميها البنية التحتية الوكيلة، أي الحاجة إلى إنشاء مصنع توكن أكثر ذكاءً. هذا ما نعمل عليه في Wuwen Xinqiong حاليًا. من منظور بعيد المدى، عندما يأتي عصر AGI، نعتقد أن حتى البنية التحتية يجب أن تكون وكيلًا. يجب أن يكون المصنع الذي نعمل عليه قادرًا على التطور الذاتي، والتكرار الذاتي، وتشكيل منظمة ذاتية. بمعنى أنه سيكون لديه مدير تنفيذي، وهذا المدير هو وكيل، يمكن أن يكون Claw، يدير البنية التحتية بأكملها وفقًا لاحتياجات العملاء من الذكاء الاصطناعي، يطلب احتياجاته، ويقوم بتكرار بنيته التحتية. بهذه الطريقة، يمكن أن تتشكل علاقات أفضل بين الذكاء الاصطناعي والذكاء الاصطناعي. لذا نحن نعمل أيضًا على تحسين قدرات التواصل بين الوكلاء، مما يتيح قدرات النسخ من نقطة إلى نقطة.

لذا، نحن دائمًا نفكر في أن تطور البنية التحتية والذكاء الاصطناعي لا ينبغي أن يكون في حالة عزل، بل يجب أن يكون هناك تفاعل كيميائي غني. أعتقد أن هذا هو ما يُعرف بالتعاون بين البرمجيات والأجهزة، وكذلك بين الخوارزميات والبنية التحتية.

يانغ تشي لين

مؤخراً، أيضًا، قامت Xiaomi بإصدار نماذج جديدة، بما في ذلك فتح بعض التقنيات وراءها، وأنا أعتقد أن ذلك قد قدم مساهمة كبيرة للمجتمع. لذا، أود أن أسأل، ما هي المزايا الفريدة التي تعتقد أن Xiaomi تمتلكها في تطوير النماذج الكبيرة؟

لوه فولي

أعتقد أنه من الأفضل أن نتجاوز الحديث عن المزايا الفريدة لـ Xiaomi في تطوير النماذج الكبيرة، وأرغب في مناقشة مزايا الفرق الصينية في تطوير النماذج الكبيرة. أعتقد أن هذه الموضوعات تحمل قيمة أوسع.

في الواقع، قبل حوالي عامين، رأيت أن فرق النماذج الكبيرة في الصين حققت تقدمًا كبيرًا. هذا التقدم يتعلق بكيفية تجاوز القيود المفروضة على قوة الحوسبة المحدودة، وخصوصًا في ظروف قيود عرض النطاق الترددي مثل NVLink، وكيفية القيام بابتكارات في هيكل النماذج التي قد تبدو وكأنها تنازلات من أجل الكفاءة، مثل DeepSeek V2 وV3 وسلسلة MoE. ولكن يمكننا أن نرى أن هذه الابتكارات قد أثرت على تحول كبير. هذا التحول هو كيفية تحقيق أقصى مستوى ذكاء ضمن قيود القوة الحسابية.

لماذا أعتقد أن الابتكار الهيكلي مهم جدًا؟ لأنه كما ناقشنا للتو موضوع OpenClaw. إذا جربت OpenClaw بشكل حقيقي، ستجد أنه يصبح أسهل في الاستخدام وأذكى مع كل استخدام. الشرط الأساسي هو سياق الاستدلال.

إن سياق الاستدلال هو موضوع ناقشناه لفترة طويلة. لكن الآن، إذا اكتشفت أن هناك نموذجًا يعمل بشكل جيد في سياقات طويلة، فأداؤه قوي جدًا، وتكاليف الاستدلال منخفضة جدًا. في الواقع، ليست العديد من النماذج غير قادرة على هذا، بل إن تكلفتها مرتفعة جدًا وسرعتها بطيئة جدًا. لذا، كيف يمكن أن تحقق تكاليف منخفضة وسرعة عالية في سياق واحد أو عشرة ميغابايت، هو ما سيتيح حقًا تكليف النماذج بمشاريع ذات تعقيد أعلى، مما سيمكننا من تحقيق التكرار الذاتي للنماذج.

ما يُقصد بالتكرار الذاتي للنموذج هو أنه يمكنه، في بيئة معقدة، اعتمادًا على سياق طويل جدًا، إجراء تحسين ذاتي. قد يكون هذا تحسينًا لإطار الوكيل نفسه، أو تحسينًا للمعاملات الخاصة بالنموذج. لأننا نعتقد أن السياق الطويل هو في حد ذاته تطور للمعاملات. لذا، كيفية تحقيق بنية فعالة وسياق طويل، وكذلك كيفية تحقيق فعالية في السياق الطويل على جانب الاستدلال، هو تنافس شامل.

بالإضافة إلى ما ذكرته حول كيفية تحقيق بنية فعالة في السياق الطويل في التدريب، هذا قد يكون سؤالًا بدأنا في استكشافه قبل عام. لكن الآن، كيفية تحقيق استقرار في المهام ذات المسافات الطويلة في السياق الحقيقي، هو نموذج جديد للتكرار والابتكار الذي نعمل عليه. نحن نفكر في كيفية بناء خوارزميات تعلم أكثر فعالية، وكيفية جمع نصوص حقيقية تحتوي على اعتماد فعلي في سياقات واحدة، عشرة، أو مئة ميغابايت، بالإضافة إلى مسارات معقدة. هذا ما نمر به حاليًا في التكرار.

لكن ما أراه هو أن النماذج الكبيرة تتقدم بسرعة، ومع وجود إطار الوكيل الذي يدعمها بشكل أفضل. نحن نرى الطلب على الاستدلال، وأعتقد أن ما حدث هذا العام هو زيادة بنسبة عشرة أضعاف مقارنة بالفترة الماضية. هل يمكن أن يصل إجمالي الزيادة في التوكن إلى 100 ضعف هذا العام؟ هنا، نحن ندخل بعدًا آخر من المنافسة، وهي قدرة الحوسبة أو شرائح الاستدلال، حتى الأمور المتعلقة بالطاقة.

يانغ تشي لين

هوانغ تشاو، لقد طورت أيضًا بعض المشاريع المؤثرة في مجال الوكلاء، كيف ترى من منظور harness الوكيل أو تطبيقاته، ما هي الاتجاهات التقنية التي تعتقد أنها مهمة في المستقبل، والتي يجب أن نركز عليها؟

هوانغ تشاو

أولاً، إذا قمنا بتجريد بعض التقنيات الخاصة بالوكيل، فهناك بعض النقاط الرئيسية، مثل التخطيط، والذاكرة، واستخدامها.

بالنسبة للتخطيط، أعتقد أن المشكلة الحالية تتعلق ببعض المهام المعقدة، أو السياقات المتعددة. أعتقد أن العديد من النماذج قد لا تتمكن من القيام بالتخطيط بشكل جيد، لأنني أعتقد أن لديها معرفة ضمنية محدودة، خاصة في العديد من المجالات المتخصصة. أعتقد أنه ينبغي أن يتم تعزيز التخطيط في المستقبل من خلال دمج المعرفة المعقدة الموجودة في النماذج.

أما بالنسبة للمهارات، أعتقد أن الجوهر في بعض النواحي قد يشمل أيضًا harness، الذي أعتقد أنه يخفف الأخطاء الناتجة عن التخطيط. لأنه يقدم بعض المهارات عالية الجودة، وهو أيضًا دليل للنموذج لإكمال مهام معقدة.

أما بالنسبة للذاكرة، فإنها تثير لدينا شعورًا بأن هناك دائمًا مشكلات مثل ضغط المعلومات بشكل غير دقيق. وفي بعض السيناريوهات المعقدة، يمكن أن تتضخم الذاكرة بشكل كبير. أعتقد أن هذه الأمور تتطلب ضغطًا على الذاكرة. لكن حاليًا، مثل الأنواع المختلفة من الروبيان، يستخدم الجميع أبسط أنواع الذاكرة مثل نظام الملفات، من خلال مشاركة بعض الملفات. أعتقد أن هذا الأمر قد يتطلب أن تبتكر الذاكرة تصميمًا هرميًا، وكيفية جعل الذاكرة أكثر عمومية.

أعتقد أن آلية الذاكرة بأكملها قد يصعب جعلها شاملة. على سبيل المثال، في سيناريوهات البرمجة، والبحث العميق، والمجالات المتعددة الوسائط، ستختلف أنماط البيانات بشكل كبير. كيف يمكن إجراء فهرسة جيدة للذاكرة، أعتقد أن هذه دائمًا ما تكون في حالة تبادل.

نقطة أخرى هي أن الروبيان قد خفضت بشكل كبير من عتبة إنشاء الوكلاء، لذلك في المستقبل قد يكون هناك أكثر من روبيان واحد. أرى أن Kimi قد قدمت أيضًا آلية سرب الوكلاء، مما يعني أنه في المستقبل، قد يمتلك كل شخص مجموعة من الروبيان. سيكون سياقهم ضخمًا، ويمكنك أن تتخيل أن الضغط على الذاكرة سيكون كبيرًا جدًا. لكن حاليًا، لا توجد آلية جيدة لإدارة السياق العام الناتج عن مجموعة من الروبيان.

أما بالنسبة لاستخدامها، فقد كانت هناك مشكلات في MCP، حيث لا تزال المهارات تعاني من مشكلات. على سبيل المثال، كانت هناك مشكلات تتعلق بجودة المهارات، وقد تكون هناك مشكلات تتعلق بالأمان. حاليًا، على الرغم من وجود العديد من المهارات، إلا أن المهارات عالية الجودة نادرة، وللأسف، قد تؤثر المهارات منخفضة الجودة على إنجاز المهام بشكل كبير. علاوة على ذلك، قد تتعرض المهارات أحيانًا لمشكلات من إدخال خبيث. لذا، من ناحية الاستخدام، أعتقد أننا بحاجة إلى المجتمع بأسره لتحسين تطوير المهارات، أو حتى كيف يمكن أن تتطور مهارات جديدة خلال عملية التنفيذ.

يانغ تشي لين

تحدث الضيفان السابقان من وجهات نظر مختلفة حول قضية واحدة. وهي أنه مع زيادة تعقيد المهام، يرتفع السياق بشكل كبير. قد يكون من الممكن على مستوى النموذج زيادة طول السياق الأصلي؛ ومن الممكن على مستوى harness الوكيل، مثل التخطيط، والذاكرة، بما في ذلك harness الوكلاء المتعددين، في الواقع، يمكن أن يدعم أيضًا مهام أكثر تعقيدًا ضمن قدرة نموذج معين. أعتقد أن هذين الاتجاهين قد ينتجان المزيد من التفاعلات الكيميائية التي يمكن أن تعزز إكمال صعوبة هذه المهام.

في النهاية، دعونا نتطلع إلى المستقبل بشكل مفتوح، لذا أود أن أطلب من الجميع أن يستخدموا كلمة واحدة لوصف اتجاهات تطوير النماذج الكبيرة وتوقعاتكم في الأشهر الـ 12 المقبلة.

هوانغ تشاو

أشعر أن 12 شهرًا تبدو بعيدة جدًا في مجال الذكاء الاصطناعي، ولا أعرف كيف ستكون الأمور بعد 12 شهرًا.

يانغ تشي لين

كان مكتوبًا في الأصل خمس سنوات، وأنا قمت بتقصيرها.

هوانغ تشاو

أعتقد أن الكلمة من جانبي قد تكون “النظام البيئي”. الآن، الروبيان جعل الجميع نشطين، ومن المهم جدًا أن يتحول الوكلاء إلى مساعدين شخصيين حقيقيين، خاصة عندما يتحولون إلى عمال. لأن العديد من الناس حاليًا يلعبون بالروبيان بدافع الفضول، ربما لأنهم يجدون الأمر ممتعًا. لكن أعتقد أنه يجب على الروبيان أن يتحولوا إلى أدوات لنقل الأشياء، أو أن يصبحوا في حالة حقيقية من التعاون. لذا، أعتقد أن هذه النقطة تتطلب جهودًا من النظام البيئي بأسره.

أعتقد أن فتح المصدر يعد أمرًا مهمًا، حيث إنه بعد فتح جميع التقنيات ذات الصلة، بما في ذلك العديد من التقنيات الخاصة بالنماذج، يتعين على الجميع العمل معًا لبناء النظام البيئي بالكامل. سواء كان ذلك في تطوير النماذج، أو تطوير منصة المهارات، أو الأدوات المختلفة. أعتقد أن هذا يتطلب تحسينًا للأفضل، مما يتيح خلق نظام بيئي أفضل للروبوتات.

أشعر أن ما هو واضح هو أن العديد من البرامج المستقبلية، بما في ذلك ظهور الروبيان، ستجعل الناس يتساءلون: هل ستظل البرامج موجهة إلى البشر في المستقبل؟

نعتقد أنه قد لا تكون معظم البرامج في المستقبل موجهة للبشر، لأن البشر يحتاجون إلى واجهة مستخدم رسومية، بل قد تكون موجهة للاستخدام الأصلي للوكيل. وهذا يتطلب من النظام البيئي بأسره تحويل أنظمة البرمجيات والبيانات، بالإضافة إلى جميع التقنيات، إلى أنماط موجهة للوكيل، مما يجعل تطور الوكلاء أكثر غنى.

لوه فولي

أعتقد أن تقليص هذا السؤال إلى عام واحد هو أمر ذو معنى كبير. لأن خمس سنوات، من وجهة نظري حول تعريف AGI، أعتقد أنه تم تحقيقه بالفعل. لذا، إذا كان عليّ استخدام كلمة واحدة لوصف ما سيكون الأمر الأكثر أهمية في رحلة AGI في العام المقبل، أعتقد أن الأمر سيكون التطور الذاتي.

على الرغم من أن هذه الكلمة قد تبدو غامضة قليلاً، لكنني مؤخرًا فقط بدأت أفهم ما تعنيه. أو كيف يمكن تنفيذ التطور الذاتي، سيكون هناك خطة أكثر واقعية.

السبب في ذلك هو الاستفادة من نماذج قوية، لأننا في إطار الحوار لم نستغل الحد الأقصى للقدرة في النماذج المدربة. هذا الحد الأقصى تم تنشيطه الآن من خلال إطار الوكلاء. نرى أنه عندما تنفذ النماذج مهامًا لفترات زمنية أطول، فإنها تتعلم وتتحسن من تلقاء نفسها. تجربة بسيطة هي أنه عندما تضيف شرطًا يمكن التحقق منه إلى إطار الوكيل الحالي، ثم تضبط حلقة، وتسمح للنموذج بالاستمرار في تحسين هذا الهدف، سنجد أن النموذج سيخرج بحلول أفضل. إذا استمر هذا النوع من التطور الذاتي، فإن النماذج المحلية يمكنها في الأساس العمل لعدة أيام الآن.

لذا من وجهة نظري، أعتقد أن التطور الذاتي هو المكان الوحيد الذي يمكن أن يخلق شيئًا جديدًا. إنه ليس بديلًا عن إنتاجيتنا الحالية، بل هو مثل أفضل العلماء الذين يستكشفون أشياء لم تكن موجودة في هذا العالم.

في الواقع، قبل عام، كنت أعتقد أن هذه المدة الزمنية ستستغرق من 3 إلى 5 سنوات. ولكن مؤخرًا، أشعر أن هذه المدة الزمنية يجب أن تُختصر إلى عام أو عامين، ومن المحتمل أن نتمكن من إضافة إطار وكيل ذو تطور ذاتي قوي إلى النماذج الكبيرة، مما يحقق تسريعًا كبيرًا في البحث العلمي.

لأنني مؤخرًا اكتشفت أن زملاءنا الذين يعملون على الأبحاث المتعلقة بالنماذج الكبيرة، لديهم تدفق عمل غير مؤكد للغاية، ويمتلكون إبداعًا عاليًا. ووجدنا أن الاستفادة من Claude Code مع نماذج رائدة قد تسارع كفاءتنا في البحث إلى ما يقرب من عشرة أضعاف. لذلك، أتطلع إلى هذه الطريقة لتوسيع نطاقها لتشمل مجالات وتخصصات أوسع، وأعتقد أن التطور الذاتي هو أمر بالغ الأهمية.

شيا لي شيو

كلمتي الرئيسية هي “التوكن المستدام”. لأننا نرى الآن أن تطور الذكاء الاصطناعي لا يزال في مسار طويل ومستدام، ونأمل أن يكون له عمر طويل.

في هذا، من وجهة نظر البنية التحتية، نرى أن هناك مشكلة كبيرة وهي أن مواردنا في النهاية محدودة. بصفتنا مصنع توكن، هل يمكننا أن نقدم للجميع توكنات مستدامة، مستقرة، وبكميات كبيرة، حتى تتمكن النماذج الرائدة من تقديم الخدمة لمزيد من التطبيقات في أسفل السلسلة، هذه هي النقطة المهمة التي نراها. لذا، نحن بحاجة إلى توسيع منظورنا إلى النظام البيئي بأسره. من تحول الطاقة إلى القدرة الحاسوبية، ثم إلى التوكن، وأخيرًا إلى الناتج المحلي الإجمالي، يمكننا إجراء تكرار اقتصادي مستدام.

بما في ذلك أننا لا نستخدم فقط جميع أنواع القوة الحاسوبية في البلاد، بل نحن أيضًا نعمل على تصدير هذه القدرات إلى الخارج، وفتح الموارد العالمية وتكاملها. لذلك، أعتقد أن الاستدامة تهدف أيضًا إلى بناء نموذج اقتصادي خاص بالصين قائم على التوكن. لأنه في العصور السابقة، كان لدينا “صنع في الصين”. سنجد أنه يمكننا تحويل القدرة التصنيعية منخفضة التكلفة في الصين إلى منتجات جيدة يتم تصديرها للعالم. ما نريد القيام به الآن هو شيء مشابه لـ “AI صنع في الصين”، حيث يمكننا تحويل مزايانا في الطاقة الصينية من خلال هذه المصانع إلى توكنات عالية الجودة يتم تصديرها للعالم. لنصبح مصنع توكن عالمي، هذا ما أتمنى أن أراه في العام الحالي كقيمة تقدمها الصين للعالم في مجال الذكاء الاصطناعي.

زانغ بينغ

سأكون مختصرًا، ربما يكون الجميع يتطلعون إلى النجوم، لكنني سأكون أكثر واقعية. أعتقد أن الكلمة الرئيسية التي أود أن أقولها عن أكبر مشكلة سنواجهها في الأشهر الـ 12 المقبلة هي القدرة الحاسوبية. لأنه كما ذكرت، جميع هذه التقنيات، بما في ذلك إطار الوكيل، تمنح الكثير من الناس إبداعًا جيدًا، وزيادة في الكفاءة بمقدار عشرة أضعاف. لكن الشرط الأساسي هو أنه يجب أن يتمكن الجميع من استخدامها.

لا يمكنك أن تقول إن القدرة الحاسوبية غير كافية، وتطرح سؤالاً، ويتعين عليه التفكير لفترة طويلة دون إعطائك إجابة، فهذا بالتأكيد غير مقبول. وبسبب هذه الأسباب، قد تتعطل تقدم أبحاثنا، والعديد من الأشياء التي نريد القيام بها.

قبل عامين، أذكر أن الأكاديمي يي تشين كان يتحدث في منتدى تشونغوانتسون، وقال جملة تظل عالقة في ذهني، وهي “لا بطاقة لا مشاعر، الحديث عن البطاقة يجرح المشاعر”. أعتقد أننا وصلنا إلى هذه النقطة مرة أخرى، ولكن الوضع مختلف. ربما نحن في مرحلة الاستدلال. الانتقال إلى مرحلة الاستدلال ناتج عن انفجار حقيقي في الطلب، بمعدل عشرة أضعاف أو مئات الأضعاف. لكن إذا كنت تقول إن الطلب السابق كان عشرة أضعاف، في الواقع، الطلب هو مئة ضعف، فما زال هناك طلب كبير لم يتم تلبيته، ماذا سنفعل؟ نحتاج جميعًا للعمل معًا لإيجاد حل.

(المحرر: وانغ تشي تشوانغ HF013)

     **إخلاء المسؤولية**: تعبر هذه المقالة عن وجهات نظر الكاتب فقط، ولا تتعلق بموقع Hexun. يحتفظ موقع Hexun بموقف محايد بشأن التصريحات والآراء الواردة في المقالة، ولا يقدم أي ضمانات صريحة أو ضمنية بشأن دقة أو موثوقية أو اكتمال المحتوى. يجب على القراء الاعتماد على المعلومات على مسؤوليتهم الخاصة. البريد الإلكتروني: news_center@staff.hexun.com

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.