شركة يابانية ناشئة في مجال الذكاء الاصطناعي تطرح Sakana Fugu: استدعاء تلقائي لنماذج متعددة يمكن أن ينافس Claude Mythos؟ عرض الأداء والأسعار مرة واحدة

عدة نماذج ذكاء اصطناعي تعمل بشكل تعاوني، وتعرض واجهة برمجة تطبيقات واحدة فقط، أعلنت Sakana AI رسميًا عن إصدار Sakana Fugu في 22 يونيو 2026، وهو نظام يضم نماذج تنسيق مدربة بواسطة التعلم المعزز لتوزيع المهام تلقائيًا على عدة وكلاء متخصصين.
(ملخص سابق: تعرضت شركة Anthropic للحظر من قبل الحكومة الأمريكية وسحبت نموذج Fable، وتشير وسائل الإعلام إلى ثلاثة مخاوف رئيسية: قد يساعد في دعم الذكاء الاصطناعي مفتوح المصدر في الصين)
(معلومات إضافية: ماسك يتحول إلى تاجر أسلحة حوسبة! SpaceX توقع عقدًا بقيمة 6.3 مليار دولار مع Reflection، وتؤجر Nvidia GB300 لدعم الذكاء الاصطناعي مفتوح المصدر)

فهرس المقال

تبديل

  • كيف يعمل نموذج القائد
  • نماذج عالية الأداء محدودة القدرات
  • هيكل التسعير وقيود السوق

تشغيل عدة نماذج ذكاء اصطناعي رائدة في آن واحد، ولكن مع استدعاء واجهة برمجة تطبيقات واحدة فقط، هذا هو الرهان الرئيسي لـ Sakana AI على Fugu. يوم الاثنين (22)، أطلقت Sakana AI اليابانية رسميًا Sakana Fugu.

تحديده كـ「نظام يستبدل نموذجًا واحدًا」: إطار عمل يوجه عدة وكلاء متخصصين للعمل بشكل تعاوني، ويكشف عن واجهة API قياسية متوافقة مع OpenAI فقط. لا يحتاج المستخدمون لمعرفة عدد النماذج التي تعمل في الخلفية، ولا ليديروا عمليات التعاون يدويًا، كل شيء يُدار بواسطة آلية التوجيه الداخلية لـ Fugu.

كيف يعمل نموذج القائد

هناك ابتكاران في البنية التحتية لـ Fugu: TRINITY و Conductor.

TRINITY صمم بنية تقسيم ثلاثية الأوجه: تُقسم المهمة إلى ثلاثة أدوار، "المفكر" (Thinker) يخطط، "العامل" (Worker) ينفذ، و"المدقق" (Verifier) يكتشف الثغرات.

يتم تعيين الأدوار الثلاثة بواسطة نماذج لغة كبيرة مختلفة، مما يشكل فريق عمل متوازن. ببساطة: لا يُسمح لنموذج واحد أن يخطط ويصحح في نفس الوقت.

Conductor هو جوهر النظام، وهو نموذج تنسيق مدرب بواسطة التعلم المعزز بثمانية مليارات معلمة، مسؤول عن تحديد أي وكلاء يجب استدعاؤهم لكل مهمة، وكيفية تواصلهم، وكيفية دمج النتائج النهائية. هذا النموذج لا يعتمد على سير عمل مصمم مسبقًا، بل يتعلم بنفسه اكتشاف أنسب طرق التعاون، وتطلق عليه Sakana اسم "نمط تعاون غير بديهي لكنه فعال".

يمكن تعديل مجموعة الوكلاء بشكل مرن. مستوى Standard يسمح للشركات باستبعاد مزودين أو نماذج معينة، لتلبية متطلبات الخصوصية أو الامتثال، وهو تصميم يميز النظام بشكل حاسم للمؤسسات التي لا تسمح بخروج البيانات.

نماذج عالية الأداء محدودة القدرات

قامت Sakana بمقارنة أداء Fugu مع نماذج رائدة عبر أربعة معايير اختبار.

  • SWE Bench Pro (قدرة إصلاح كود البرمجيات): Fugu 59.0، Fugu Ultra 73.7
  • LiveCodeBench (مسابقة برمجة فورية): Fugu 92.9، Fugu Ultra 93.2
  • GPQA Diamond (أسئلة متعددة التخصصات على مستوى الدراسات العليا، تقارب اختبار الدكتوراه): Fugu و Fugu Ultra كلاهما 95.5
  • Humanity’s Last Exam (مجموع أسئلة صعبة من قبل خبراء عالميين): Fugu 47.2، Fugu Ultra 50.0

تدعي Sakana أن هذه الأرقام "تقارب أداء نماذج Mythos Preview و Fable 5" في اختبارات صارمة، لكن لا تزال بحاجة إلى تصديق من جهات خارجية.

هيكل التسعير وقيود السوق

يوفر Fugu ثلاثة مستويات اشتراك: Standard مقابل 20 دولار شهريًا، وPro مقابل 100 دولار شهريًا (عشرة أضعاف الاستخدام)، وMax مقابل 200 دولار شهريًا (عشرين ضعف الاستخدام)، وتشمل جميعها حقوق استخدام Fugu و Fugu Ultra.

كما تقدم خطة فواتير للشركات باستخدام رموز التوكن، حيث تبلغ تكلفة Fugu Ultra 5 دولارات لكل مليون توكن إدخال، و30 دولار لكل مليون توكن إخراج؛ ولحالات السياق الطويل التي تتجاوز 272,000 توكن، يتم تعديل الأسعار إلى 10 دولارات للإدخال و45 دولار للإخراج.

منطق الفوترة الجدير بالاهتمام هو أن Sakana تؤكد أن استدعاء المزيد من الوكلاء في المهمة لا يعني بالضرورة زيادة التكاليف بشكل متناسب. تعتمد آلية التسعير على أعلى نموذج في مجموعة الوكلاء النشطة، وتحسب تكلفة موحدة مختلطة، بمعنى أن إضافة وكيل ثاني أو ثالث لا يضاعف الفاتورة، مما يمنح ميزة واضحة من حيث التكاليف مقارنة بالربط مع عدة واجهات برمجة تطبيقات بشكل مستقل.

القيود الحالية الأكثر وضوحًا تتعلق بالموقع الجغرافي: لا يتيح Fugu للمستخدمين في الاتحاد الأوروبي والمنطقة الاقتصادية الأوروبية (EEA)، والسبب الرسمي هو أن الشركة تعمل على الحصول على شهادة الامتثال لـ GDPR، ولم يُحدد موعد الانتهاء. يمكن للمستخدمين الأوائل الذين يشترون اشتراكًا قبل يوليو 2026 الحصول على شهر ثانٍ مجانًا.

تشغيل عدة نماذج بشكل تعاوني يتفوق على نموذج واحد، وهذه ليست فكرة جديدة قدمتها Sakana. ما يروجون له حقًا هو أن كل وكيل في بنية القائد يمكن استبداله، وأن سقف النظام لا يُقيد بأي مزود واحد.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت