عدم تعديل الأوزان، ضبط API فقط: Poetiq "إضافة خارجية" تجعل Kimi ترتفع بنسبة 29.9 نقطة مئوية، نسخة خفيفة من Gemini تتفوق على Claude Opus

robot
إنشاء الملخص قيد التقدم
رسالة AIMPACT، 15 مايو (بتوقيت UTC+8)، وفقًا لمراقبة Beating، أعلنت فريق ناشئ مكون من 6 أشخاص يُدعى Poetiq، أسسه الباحثان السابقان في Google و DeepMind، Shumeet Baluja و Ian Fischer، أن نظام Meta-System الخاص بهم حقق أعلى نتيجة على معيار البرمجة LiveCodeBench Pro. هذا النظام هو أداة مساعدة ذكية تعتمد تمامًا على صلاحية الوصول عبر API، وتقوم بتحسين ذاتي متكرر لاستخراج خبرة المهام تلقائيًا. أظهرت الاختبارات الرسمية أنه، دون لمس أوزان النموذج أو إجراء تعديل دقيق، قام هذا النظام مباشرة برفع قدرة الشفرات لأغلب النماذج الكبيرة السائدة في السوق. أظهرت النتائج أن هذا الحل المعتمد على فصل الأداة عن النموذج يُظهر تحسينات واضحة بشكل خاص على النماذج ذات القدرات الأضعف. بعد دمج نظام Poetiq، ارتفعت دقة Kimi K2.6 من 50.0% إلى 79.9%، بزيادة قدرها 29.9 نقطة مئوية؛ كما زادت نتائج Gemini 3.0 Flash الخفيفة الوزن بنسبة 10 نقاط مئوية، متفوقة على إصدارها الكبير Gemini 3.1 Pro، وتفوقت بشكل ملحوظ على Claude Opus 4.7 و GPT 5.2 High، اللذين وصفهما Poetiq بأنه «أكبر وأغلى». فيما يتعلق بحدود الأداء، حقق GPT 5.5 High الذي كانت نتيجته 89.6% ارتفاعًا جديدًا إلى 93.9% مع دعم الأداة؛ بينما حصل الإصدار الأساسي من Gemini 3.1 Pro على 90.9% عند استخدام الأداة، متجاوزًا النموذج الأقوى من Google الذي لم يفتح API الخاص به بعد، وهو Gemini 3 Deep Think، الذي كانت نتيجته 88.8%. وذكر فريق Poetiq أن التعديلات الدقيقة التقليدية تُقيد تحسينات النموذج على نموذج واحد فقط، بينما تتيح لهم هذه الأداة القابلة للفصل والتوصيل بشكل سلس أن تتجنب الشركات التكاليف العالية المرتبطة بالتعديل الدقيق ونشر النماذج الكاملة. (المصدر: BlockBeats)
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 7
  • 2
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
CandleChaser
· منذ 7 س
هل يعني أن فكرة النماذج الضعيفة + الإضافات القوية تشير إلى قدوم ربيع النماذج الصغيرة؟
شاهد النسخة الأصليةرد0
GateUser-b74aba1c
· منذ 13 س
فريق مكون من ستة أشخاص يتجاوز عنق الزجاجة في استدلال النماذج الكبيرة، والابتكار في طبقة API تم التقليل من شأنه لفترة طويلة
شاهد النسخة الأصليةرد0
L2ArbitrageTrader
· منذ 13 س
Poetiq ستة أشخاص حققوا هذا التأثير، تكوين الفريق يستحق الدراسة
شاهد النسخة الأصليةرد0
CyberBridgeDeepPerspective
· منذ 13 س
GPT5.5 عالي الأداء وصل إلى 93.9٪، وGemini3.1 Pro حقق 90.9٪ بعد التكوين، هذا الإضافة تتفوق على النسخة الأصلية ذات المواصفات القصوى
شاهد النسخة الأصليةرد0
GateUser-cbb8cdf5
· منذ 13 س
شركة في غاية السعادة، أخيرًا لم يعد من الضروري إنفاق المال على التعديلات الدقيقة
شاهد النسخة الأصليةرد0
BribeCoffee
· منذ 13 س
التحسين الذاتي التكراري واستخراج الخبرة، بنية Meta-System هذه لها بعض الاهتمام
شاهد النسخة الأصليةرد0
VineGeometry
· منذ 13 س
الإضافات الخارجية للواجهة البرمجية البحتة يمكنها جعل Kimi يقفز من 50% إلى 79% دون لمس الأوزان، وهذه الطريقة أذكى بكثير من التعديلات الدقيقة.
شاهد النسخة الأصليةرد0
  • مُثبت