OpenRouter يطلق واجهة برمجة التطبيقات Fusion: تقريب مزيج من ثلاثة نماذج Fable 5، والتكلفة نصف ذلك فقط

OpenRouter في 13 يونيو أطلق رسميًا واجهة برمجة التطبيقات Fusion، التي تتيح للمطورين استدعاء نماذج متعددة بشكل متزامن من خلال API واحد، ثم يتم دمج النتائج بواسطة نموذج Judge لإخراج أفضل إجابة. في اختبار معيار البحث العميق DRACO، تفوقت Fusion بنسبة 69% على Claude Fable 5 الذي حقق 65.3%، بينما مجموعة من النماذج منخفضة التكلفة المكونة من Gemini 3 Flash و Kimi K2.6 و DeepSeek V4 Pro حققت أقل من 1% فقط فرق، مع نصف التكلفة.

(مقدمة سابقة: استثمار Google في منصة توجيه الذكاء الاصطناعي OpenRouter، وتقييمها بقيمة 1.3 مليار دولار، ونموها بنسبة 240% خلال عام)

(معلومات إضافية: تحليل OpenRouter لـ 100 تريليون توكن في تقارير بحثية: ماذا يستخدم البشر فعلاً للذكاء الاصطناعي، صعود النماذج الصينية، وأسرار احتفاظ المستخدمين)

فهرس المقال

Toggle

  • اختبار معيار DRACO: Fusion يتفوق بشكل كامل على النماذج الفردية
  • حتى لو كانت الميزانية محدودة، يمكنها المنافسة: دمج ثلاثة نماذج أقل من Fable بنسبة أقل من 1%
  • Fusion ليس بديلاً عن Fable، لكنه مناسب لمواقف محددة بوضوح
  • أربع طرق للاستدعاء، مرة واحدة لفهمها

منصة توجيه الذكاء الاصطناعي الشهيرة OpenRouter أطلقت رسميًا في 13 يونيو واجهة Fusion، التي تسمح للمطورين بإرسال نفس السؤال إلى نماذج متعددة في آن واحد، ثم يقوم نموذج Judge بدمج جميع المخرجات وتحليلها بشكل هيكلي، يتضمن نقاط الاتفاق، والتناقض، والتغطية الجزئية، والآراء الفريدة، والنقاط العمياء، وأخيرًا يكتب النموذج النهائي بناءً على هذا التحليل. يتم تنفيذ جميع العمليات على الخادم، بحيث يكون التجربة مشابهة تمامًا لاستدعاء نموذج واحد.

اختبار معيار DRACO: Fusion يتفوق بشكل كامل على النماذج الفردية

قيم فريق OpenRouter أداء Fusion باستخدام معيار DRACO من Perplexity AI، الذي يشمل 100 مهمة بحثية معقدة عبر 10 مجالات، ويقيم الدقة (حوالي 20 بندًا)، والانتشار والعمق (حوالي 9 بنود)، وجودة العرض (حوالي 6 بنود)، وجودة المصادر (حوالي 5 بنود)، مع وجود آلية وزن سلبية، بحيث يعاقب النموذج عند تقديم معلومات خاطئة.

وفيما يلي نتائج التقييم لكل إعداد:

  • Fusion (Fable 5 + GPT-5.5 → دمج Opus 4.8): 69.0% 🥇
  • Fusion (Opus 4.8 + GPT-5.5 + Gemini 3.1 Pro → دمج Opus 4.8): 68.3%
  • Fusion (Opus 4.8 + GPT-5.5 → دمج Opus 4.8): 67.6%
  • Fusion (دمج Opus 4.8 مع نفسه): 65.5%
  • Claude Fable 5 كنموذج فردي: 65.3% (تم إكمال 93 من 100 سؤال، بسبب حظر مرشح المحتوى)
  • Fusion (Gemini 3 Flash + Kimi K2.6 + DeepSeek V4 Pro → دمج Opus 4.8): 64.7% 🔥
  • DeepSeek V4 Pro كنموذج فردي: 60.3%
  • GPT-5.5 كنموذج فردي: 60.0%
  • Claude Opus 4.8 كنموذج فردي: 58.8%

الميزانية المحدودة أيضًا قادرة على المنافسة: دمج ثلاثة نماذج أقل من Fable بنسبة أقل من 1%

النتيجة المذهلة جاءت من مجموعة "ميزانية محدودة"، تتكون من نماذج Gemini 3 Flash و Kimi K2.6 و DeepSeek V4 Pro، التي بعد دمجها عبر Fusion حصلت على 64.7%، متفوقة على GPT-5.5 (60.0%) و Opus 4.8 (58.8%)، وتقريبًا لا تفصلها عن Claude Fable 5 سوى أقل من 1%، مع نصف التكلفة. هذا يعني أن المطورين يمكنهم الحصول على قدرات بحث عميق تقارب النماذج الرائدة بأقل تكلفة.

ملاحظة مهمة أخرى: "الدمج الذاتي" فعال أيضًا. عندما يتم دمج نموذج Opus 4.8 مع نفسه (نموذجان من نفس الإصدار في Panel واحد) ويُستخدم كـ Judge، حصل على 65.5%، متفوقًا على أداءه الفردي عند 58.8% بمقدار 6.7%. هذا يوضح أن جزءًا كبيرًا من فاعلية Fusion يأتي من خطوة التوليف، حيث أن تشغيل نفس النموذج مرتين، مع مسارات استنتاج مختلفة، واستخدام أدوات وموارد مختلفة، يمكن أن يحقق مكاسب ملحوظة.

Fusion ليس بديلاً عن Fable، لكنه واضح الاستخدام

قال الرئيس التنفيذي لـ OpenRouter، أليكس أتالايان، على منصة X إن Fusion يمكن أن يصل إلى "مستوى ذكاء Fable، بسعر نصف". ومع ذلك، يعترف الفريق أن معيار DRACO لا يشمل المهام ذات الأفق الطويل، والتي تعتبر نقطة قوة حقيقية لـ Claude Fable 5. في المهام المعقدة التي تتطلب استنتاجات متعددة الخطوات وسياق طويل، لا تزال Fable لا يمكن استبدالها في الوقت الحالي.

أما بالنسبة لسيناريوهات تطوير البرمجيات، فإن Fusion ليس حلاً مباشرًا لاستبدال نماذج البرمجة. صممت OpenRouter Fusion كأداة خادم، بحيث عندما يواجه النموذج الأساسي مشكلة تتطلب بحثًا عميقًا (مثل اتخاذ القرارات المعمارية، أو دراسات الممارسات المثلى)، يمكنه تلقائيًا تحديد ما إذا كان يجب استدعاء Fusion للحصول على تحليل متعدد الزوايا، بينما تظل كتابة الكود اليومي تتم بواسطة النموذج الرئيسي.

أربع طرق للاستدعاء، مرة واحدة لفهمها

يمكن للمطورين استخدام Fusion عبر الطرق الأربع التالية:

  • تجربة الدردشة: مباشرة عبر openrouter.ai/fusion، باختيار preset أو بناء panel خاص
  • اسم النموذج (model slug): عبر API بتحديد "model": "openrouter/fusion"، مع استخدام panel الافتراضي
  • أداة الخادم (Server tool): بإضافة {"type": "openrouter:fusion"} إلى مصفوفة الأدوات، ليقرر النموذج الرئيسي متى يستدعي Fusion
  • وضع الإضافة (Plugin mode): بإضافة معلمة plugins في استدعاء API، لتخصيص تشكيل النماذج في panel

تكلفة استدعاء panel الافتراضي أقل بنسبة حوالي 50% من Fable، لكن زمن الاستجابة يكون حوالي 2-3 أضعاف (نظرًا لانتظار عمليات استنتاج متعددة النماذج ثم الدمج). تقول OpenRouter إنها ستواصل تحسين الأداء استنادًا إلى ملاحظات المستخدمين.

المصدر: مدونة OpenRouter، من إعداد وتحرير دونغ تشوي.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت