العقود الآجلة
وصول إلى مئات العقود الدائمة
CFD
الذهب
منصّة واحدة للأصول التقليدية العالمية
الخیارات المتاحة
Hot
تداول خيارات الفانيلا على الطريقة الأوروبية
الحساب الموحد
زيادة كفاءة رأس المال إلى أقصى حد
التداول التجريبي
مقدمة حول تداول العقود الآجلة
استعد لتداول العقود الآجلة
أحداث مستقبلية
"انضم إلى الفعاليات لكسب المكافآت "
التداول التجريبي
استخدم الأموال الافتراضية لتجربة التداول بدون مخاطر
إطلاق
CandyDrop
اجمع الحلوى لتحصل على توزيعات مجانية.
منصة الإطلاق
-التخزين السريع، واربح رموزًا مميزة جديدة محتملة!
HODLer Airdrop
احتفظ بـ GT واحصل على توزيعات مجانية ضخمة مجانًا
IPO Access
افتح الوصول الكامل إلى الاكتتابات العامة للأسهم العالمية
نقاط Alpha
تداول الأصول على السلسلة واكسب التوزيعات المجانية
نقاط العقود الآجلة
اكسب نقاط العقود الآجلة وطالب بمكافآت التوزيع المجاني
عروض ترويجية
AI
Gate AI
شريكك الذكي الشامل في الذكاء الاصطناعي
Gate AI Bot
استخدم Gate AI مباشرة في تطبيقك الاجتماعي
GateClaw
Gate الأزرق، جاهز للاستخدام
Gate for AI Agent
البنية التحتية للذكاء الاصطناعي، Gate MCP، Skills و CLI
Gate Skills Hub
أكثر من 10 آلاف مهارة
من المكتب إلى التداول، مكتبة المهارات الشاملة تجعل الذكاء الاصطناعي أكثر فعالية
GateRouter
ختر بذكاء من أكثر من 40 نموذج ذكاء اصطناعي، بدون أي رسوم إضافية 0%
لماذا يجب أن تتعلم هندسة الحصان؟ تحليل كامل لـ 5 منتجات، 3 مدارس، و5 مبادئ عالمية
نظام التحليل هندسة Harness: خمسة منتجات، ثلاثة مدارس (OpenAI / Anthropic / ThoughtWorks)، خمسة مبادئ عالمية، ولماذا "تدهور Harness" يجبرك على قطع نصف التصميم كل 6 أشهر. هذا المقال مستوحى من مقال @sairahul1، تم تجميعه وترجمته بواسطة فريق 动區.
(ملخص سابق: مقدمة في هندسة Harness (الهندسة الموجهة للذكاء الاصطناعي): أحدث معايير برمجة OpenAI، تعلم كيف تصل إلى المستوى 1 بسهولة)
(معلومات إضافية: مدير YC التنفيذي يشارك أسرار الذكاء الاصطناعي: المستقبل لمن يبني أنظمة فائدة مركبة للمعلومات)
فهرس المقال
Toggle
في فبراير 2026، أنتج فريق صغير من OpenAI مليون سطر من الكود الإنتاجي.
لم يكتبوا سطراً واحداً يدويًا.
الذكاء الاصطناعي هو الذي كتبها.
والتصميم البشري هو النظام الذي يجعل الوكيل موثوقًا.
هذا النظام أصبح له اسم الآن — هندسة Harness.
خلال أسابيع، أصدرت Anthropic 3 أوراق بحثية ذات صلة. و ThoughtWorks نظمته كإطار عمل. و Philipp Schmid من Hugging Face وصفه مباشرة بأنه "أهم تخصص في 2026".
خلال 90 يومًا، تشكلت تخصص هندسة جديد. ومع ذلك، خارج فرق البنية التحتية للذكاء الاصطناعي، بالكاد يفهم أحد.
هذه المقالة تشرحها بوضوح. بدون كلام فارغ، بدون مصطلحات أكاديمية، فقط نماذج ذهنية ستحتاجها فعلاً لتطبيقها.
1. تعريف Harness
أبسط تعريف من ThoughtWorks:
Harness هو كل شيء خارج النموذج.
إزالة harness → نموذج لغة عشوائي يخمن داخل قاعدة الكود.
إضافة harness الصحيح → نظام قادر على إنتاج كود إنتاجي.
اسمها مستمد من أدوات الفروسية. Harness هو الحبل، السرج، اللجام — يوجه قوة حيوان قوي لكنه غير متوقع نحو الاتجاه المفيد.
أنت لا تجعل الحصان أذكى، أنت تصمم معدات تجعل قوته مفيدة.
2. تشبيه نظام التشغيل
أفضل تشبيه تقني من Philipp Schmid هو: فكر فيه كأنه حاسوب.
| الدور | المقابل |
| --- | --- |
| النموذج | CPU (القدرة الحاسوبية الأساسية) |
| نافذة السياق | RAM (الذاكرة المؤقتة المحدودة والمتطايرة) |
| Harness | نظام التشغيل (يدير ما يراه CPU ومتى يراه) |
| الوكيل | التطبيق الذي يعمل فوقه |
نموذجك قوي جدًا. لكن بدون نظام تشغيل يدير الذاكرة، الجدولة، القواعد — هو مجرد قطعة من السيليكون.
معظم الناس يشغلون التطبيقات بدون "نظام تشغيل". لذلك، عندما يبدأ الوكيل في الإنتاج، يتعطل.
3. ماذا تغير في 2026
استخدم LangChain نفس النموذج، وشغل على Terminal Bench 2.0 مرتين:
| Harness | النتيجة |
| --- | --- |
| harness القديم | 52.8% |
| harness الجديد | 66.5% |
نفس النموذج. harness مختلف. الفرق 13.7 نقطة مئوية.
Vercel عكس ذلك — قللوا أدوات الوكيل بنسبة 80%. النتيجة؟ أفضل، وليس أسوأ.
أكثر حقيقة غير مريحة في 2026:
إذا كانت 2025 سنة إثبات قدرة الوكيل على كتابة الكود، فإن 2026 سنة اكتشاف أن "البيئة" أهم من "النموذج".
4. ملفات AGENT.md / CLAUDE.md
أكثر منتجات harness شيوعًا.
ملفات markdown مبعثرة في أجزاء مختلفة من قاعدة الكود. الوكيل يقرأها في بداية كل جلسة — مثل وثائق التوظيف للموظف الجديد.
ماذا تحتوي؟
يسميها OpenAI AGENT.md. و Anthropic تسمّيها CLAUDE.md. و Cursor تستخدم .cursorrules.
أسماء مختلفة، نفس المبدأ. كل وحدة رئيسية نسخة، وتُحدث مع تطور المشروع.
بدونها: الوكيل يفتح كل جلسة وهو أعمى. معها: الوكيل يبدأ وهو يحمل المعلومات ويعمل.
5. قوائم ميزات JSON (متعقب التقدم)
عندما يتجاوز الوكيل جلسات متعددة لبناء تطبيق كامل، يكون سياق كل جلسة فارغ. كيف يعرف ما تم إنجازه؟
ملف JSON.
كل إدخال يكتب:
الوكيل يقرأه في بداية كل جلسة — يختار أعلى أولوية للفشل → ينفذ → يضع علامة على النجاح → يلتزم → يتكرر.
لماذا JSON وليس Markdown؟
اكتشفت Anthropic أن: احتمال أن يكتب الوكيل ملف JSON بشكل غير مقصود أقل من Markdown.
التفاصيل صغيرة، لكنها مهمة جدًا في سيناريوهات التشغيل الذاتي لمدة 6 ساعات.
6. إجراءات تهيئة الجلسة
كل جلسة تبدأ بنفس الطريقة. كل مرة.
7 خطوات لبدء التشغيل من Anthropic:
بدونها: الوكيل يقضي أول 20 دقيقة في فهم الحالة الحالية، ويعيد اختراع العجلة في كل جلسة. معها: يبدأ وهو يحمل المعلومات ويبدأ مباشرة.
7. عقود السبرينت (Sprint Contracts)
قبل كتابة أي سطر كود — يجب أن يتفاوض وكيلان.
وكيل المولد (Generator):
وكيل المراجعة (Evaluator):
إذا وافقا، يبدأ التنفيذ.
هو مراجعة تصميم. لكن كلاهما AI.
لماذا مهمة
في نفس الدورة، عندما يخطط الوكيل وينفذ، تكون النتائج غير موثوقة. خطوة "التخطيط" — حتى لو كانت AI — تعزز جودة المخرجات بشكل كبير.
8. قوالب المهام الهيكلية (Structured Task Templates)
قبل كتابة أي كود، harness يحلل قاعدة الكود الحقيقية.
ينتج خريطة تأثير grounded impact map:
ثم يبدأ التنفيذ.
يبدو بديهيًا، لكن معظم الفرق يتخطى هذه الخطوة.
الوكيل يخمن هيكل الملفات، يختتر API غير موجود، يصنع شيئًا لا يتوافق مع قاعدة الكود.
ابدأ بسياق واقعي، ثم نفذ → جودة المخرجات تتفاوت بشكل كبير.
9. مدرسة OpenAI: البيئة أولوية
فريق Codex من OpenAI لديه مشكلة غريبة:
على هذا الحجم، لا يمكنك مراجعة كل سطر يدويًا. لذلك، هم لا يفعلون ذلك.
بدلاً من ذلك — يصممون البيئة بشكل كامل بحيث يكون الوكيل من البداية قادر على إنتاج "مخرجات قابلة للمراجعة".
طرقهم
الفلسفة: صمم البيئة. ثم دع الوكيل يشتغل فيها.
الأدلة
تطبيق Sora Android. 4 مهندسين. 28 يومًا. المرتبة الأولى في Play Store. 99.9% خالي من الأعطال.
Codex يتعامل مع 70% من PRs داخليًا أسبوعيًا.
10. مدرسة Anthropic: فصل "العمل" و"المراجعة"
واجهت Anthropic مشكلة أخرى:
عندما يطلبون من الوكيل تقييم مخرجاته، يمدح نفسه بثقة — حتى لو كانت الجودة واضحة أنها متواضعة عند المراقب البشري.
التقييم الذاتي غير كافٍ. الوكيل هو طالب ومعلم في آن واحد، ويعطي نفسه تقييم كامل A.
حلهم: 3 وكلاء متخصصين
| الوكيل | الوظيفة |
| --- | --- |
| Planner | يحول طلب مكون من جملتين إلى مواصفات كاملة للمنتج |
| Generator | ينفذ مهمة في سبرينت واحد |
| Evaluator | يستخدم اختبار تلقائي عبر المتصفح، ويتصرف كأنه مستخدم حقيقي |
رؤيتهم: جعل "المُقيم المستقل" أكثر انتقادًا، أسهل بكثير من جعل المُولد ينتقد عمله.
نتائج (اختبار A/B)
| الإعداد | التكلفة | الوقت | النتيجة |
| --- | --- | --- | --- |
| وكيل واحد (بدون harness) | 9 دولارات | 20 دقيقة | تطبيق معطل |
| harness كامل | 200 دولار | 6 ساعات | برنامج يعمل وواجهة مستخدم متقنة |
11. مدرسة ThoughtWorks: إطار 2×2
يقتربون من الأمر من زوايا مختلفة — هم لا يصنعون منتجًا، بل يدرسون فشل أكثر من 50 فريق هندسي في نفس النقاط.
رؤيتهم: تصنيف كل تحكم في harness بمحورين
المحور 1: متى يعمل؟
المحور 2: كيف يعمل؟
مصفوفة 2×2
| |
| --- | --- |
| Feedforward (إرشادات) | Feedback (مستشعرات) |
| Computational | أنظمة النوع، أدوات التحقق، قواعد الهيكلية | اختبارات، تغطية، اختبارات الطفرة |
| Inferential | ملفات المواصفات، أوصاف القيود | مراجعة الكود بواسطة LLM، مدقق السلوك |
لا يمكن الاعتماد على أحدهما بمفرده. كلاهما ضروري.
12. المبدأ 1: السياق يتفوق على التعليمات
مختلف الفرق يكتشفون نفس الشيء:
الربط يكون بمسارات الملفات الحقيقية → برمجة تتوافق مع قاعدة الكود. من أوصاف غامضة إلى مسارات API مخترعة.
قبل أن يكتب الوكيل، تأكد من أنه يعرف مكانه.
13. المبدأ 2: التخطيط والتنفيذ يجب أن يكونا منفصلين
كل فريق يكتشف أن: القيام بالتخطيط والتنفيذ في نفس الدورة، يؤدي إلى نتائج غير موثوقة.
خطوة التخطيط لا يجب أن تكون من قبل الإنسان دائمًا، لكن يجب أن تكون خطوة منفصلة، ويجب أن يتم مراجعتها قبل التنفيذ.
14. المبدأ 3: حلقات التغذية الراجعة لا يمكن التنازل عنها
ثلاث مدارس تتبع نفس المبدأ بثلاث طرق:
| المدرسة | مصدر التغذية الراجعة |
| --- | --- |
| OpenAI | اختبارات تلقائية + CI |
| Anthropic | LLM آخر |
| ThoughtWorks | استخدام الاثنين معًا |
الاختلاف هو: من أين يأتي التغذية الراجعة. لكن لا خلاف على: ضرورة وجودها.
15. المبدأ 4: تنفيذ مهمة واحدة في كل مرة
محاولة إنجاز الكثير من الوكلاء في نفس الوقت تؤدي إلى:
روتين Anthropic: قراءة التقدم → اختيار ميزة واحدة → التنفيذ → الالتزام → تكرار.
"النهج التدريجي" هو القاسم المشترك بين جميع harness الناجحة.
16. المبدأ 5: قاعدة الكود هي الوثيقة
لا أحد سيقوم بصيانة قاعدة معرفات منفصلة للوكيل. المستودع هو الحقيقة الوحيدة.
إذا لم تكن المبادئ، القيود، قرارات الهيكلية موجودة في قاعدة الكود → الوكيل لن يعرفها.
المعنى العملي
17. تدهور Harness (Harness Decay) حقيقي
عندما انتقلت Anthropic من إصدار Opus 4.5 إلى 4.6 — تحليل السبرينت (الذي كان ضروريًا) أصبح عبئًا.
قدرة النموذج على التخطيط تحسنت، مما جعل تلك الأجزاء زائدة عن الحاجة.
الأجزاء التي كانت تتحمل عبء في مارس، أصبحت عبئًا في أبريل.
ثم إصدار Opus 4.7 — بدأ النموذج في التحقق من مخرجاته الخاصة، وتقلص دور وكيل التقييم مرة أخرى.
هذا هو تدهور Harness
| إصدار النموذج | الحالة |
| --- | --- |
| Opus 4.5 | تحليل السبرينت + تقييم كل سبرينت |
| Opus 4.6 | بدون تحليل السبرينت + تقييم واحد شامل (توفير 38%) |
| Opus 4.7 | التحقق الذاتي من النموذج، وتقليل دور التقييم |
البناء من أجل الحذف (Build to Delete)
نصيحة Philipp Schmid: "بناء للحذف".
عند تصميم كل مكون من مكونات harness، صممه ليكون قابلًا للإزالة.
اختبر كل مكون بشكل دوري — قم بإيقافه، وراقب إذا كانت جودة المخرجات تتأثر. إن لم تتأثر → احذفه.
| الفريق | إعادة الهيكلة خلال 6 أشهر |
| --- | --- |
| Manus | أعاد هيكلة harness 5 مرات |
| LangChain | أعاد تنظيمه 3 مرات خلال سنة |
| Vercel | أزال 80% من الأدوات → تحسن الأداء |
هذه ليست علامات على سوء الهندسة. إنها نتيجة طبيعية لـ "بناء أشياء فوق نماذج سريعة التطور".
18. الواقع من حيث التكاليف
الأرقام الصادقة من اختبار A/B لـ Anthropic:
| الإعداد | التكاليف | الوقت | النتيجة |
| --- | --- | --- | --- |
| وكيل واحد (بدون harness) | 9 دولارات | 20 دقيقة | واجهة معطلة، والنظام الأساسي معطل |
| harness كامل (Opus 4.5) | 200 دولار | 6 ساعات | نظام يعمل وواجهة متقنة، ونتائج صحيحة |
22 ضعف التكاليف — مقابل منتج يعمل فعلاً، وليس مجرد عرض توضيحي.
هل يستحق ذلك؟ يعتمد على مدى تكلفة الإصدار المعطل على فريقك.
لكن هذا الجزء غير مذكور عادة
مجموعة harness + النموذج تتطور باستمرار.
حيث أن ترقية نموذج بقيمة 200 دولار، تخفض التكاليف إلى 124 دولارًا.
| الاتجاه |
| --- |
| نموذج أفضل = harness أبسط = تكلفة أقل لكل تشغيل = نتائج أسرع |
ملخص كامل
ما هو harness
5 منتجات harness
3 مدارس
5 مبادئ عالمية
المفارقة
الفائز في 2026 ليس من يكتب أفضل كود. هم من يصمم أفضل "قيود" — ومستعدون لتركها عندما تتوقف عن جني الأرباح.