فريق Poetiq المكون من ستة أشخاص حقق أعلى درجة على LiveCodeBench Pro لنظام Meta. يعمل هذا الإضافة القائمة على واجهة برمجة التطبيقات بشكل كامل على تحسين المهام من خلال التكرار الذاتي، دون لمس الأوزان أو التعديلات الدقيقة، مما يساهم بشكل كبير في تعزيز النماذج الضعيفة. بعد الاتصال، ارتفع أداء KimiK2.6 من 50.0% إلى 79.9%، وزاد Gemini3.0 Flash بمقدار 10 نقاط، متجاوزًا بشكل مفاجئ Gemini3.1 Pro وClaude Opus4.7 وGPT5.2 High. وصل GPT5.5 High عبر الإضافة إلى 93.9%، وGemini3.1 Pro معًا إلى 90.9%، متفوقًا على Gemini3 Deep Think. لا تحتاج الشركات إلى تعديلات دقيقة عالية التكلفة لتحسين قدرات الاستنتاج.

MeNews

2026-05-24 01:02:07

إنشاء الملخص قيد التقدم

رسالة AIMPACT، 15 مايو (بتوقيت UTC+8)، وفقًا لمراقبة Beating، أعلنت فريق ناشئ مكون من 6 أشخاص يُدعى Poetiq، أسسه الباحثان السابقان في Google و DeepMind، Shumeet Baluja و Ian Fischer، أن نظام Meta-System الخاص بهم حقق أعلى نتيجة على معيار البرمجة LiveCodeBench Pro. هذا النظام هو أداة مساعدة ذكية تعتمد تمامًا على صلاحية الوصول عبر API، وتقوم بتحسين ذاتي متكرر لاستخراج خبرة المهام تلقائيًا. أظهرت الاختبارات الرسمية أنه، دون لمس أوزان النموذج أو إجراء تعديل دقيق، قام هذا النظام مباشرة برفع قدرة الشفرات لأغلب النماذج الكبيرة السائدة في السوق. أظهرت النتائج أن هذا الحل المعتمد على فصل الأداة عن النموذج يُظهر تحسينات واضحة بشكل خاص على النماذج ذات القدرات الأضعف. بعد دمج نظام Poetiq، ارتفعت دقة Kimi K2.6 من 50.0% إلى 79.9%، بزيادة قدرها 29.9 نقطة مئوية؛ كما زادت نتائج Gemini 3.0 Flash الخفيفة الوزن بنسبة 10 نقاط مئوية، متفوقة على إصدارها الكبير Gemini 3.1 Pro، وتفوقت بشكل ملحوظ على Claude Opus 4.7 و GPT 5.2 High، اللذين وصفهما Poetiq بأنه «أكبر وأغلى». فيما يتعلق بحدود الأداء، حقق GPT 5.5 High الذي كانت نتيجته 89.6% ارتفاعًا جديدًا إلى 93.9% مع دعم الأداة؛ بينما حصل الإصدار الأساسي من Gemini 3.1 Pro على 90.9% عند استخدام الأداة، متجاوزًا النموذج الأقوى من Google الذي لم يفتح API الخاص به بعد، وهو Gemini 3 Deep Think، الذي كانت نتيجته 88.8%. وذكر فريق Poetiq أن التعديلات الدقيقة التقليدية تُقيد تحسينات النموذج على نموذج واحد فقط، بينما تتيح لهم هذه الأداة القابلة للفصل والتوصيل بشكل سلس أن تتجنب الشركات التكاليف العالية المرتبطة بالتعديل الدقيق ونشر النماذج الكاملة. (المصدر: BlockBeats)

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

تسجيلات الإعجاب 5

أعجبني
5
7
2
مشاركة

تعليق

إضافة تعليق

CandleChaser

· منذ 7 س

هل يعني أن فكرة النماذج الضعيفة + الإضافات القوية تشير إلى قدوم ربيع النماذج الصغيرة؟

شاهد النسخة الأصليةرد0

GateUser-b74aba1c

· منذ 13 س

فريق مكون من ستة أشخاص يتجاوز عنق الزجاجة في استدلال النماذج الكبيرة، والابتكار في طبقة API تم التقليل من شأنه لفترة طويلة

شاهد النسخة الأصليةرد0

L2ArbitrageTrader

· منذ 13 س

Poetiq ستة أشخاص حققوا هذا التأثير، تكوين الفريق يستحق الدراسة

شاهد النسخة الأصليةرد0

CyberBridgeDeepPerspective

· منذ 13 س

GPT5.5 عالي الأداء وصل إلى 93.9٪، وGemini3.1 Pro حقق 90.9٪ بعد التكوين، هذا الإضافة تتفوق على النسخة الأصلية ذات المواصفات القصوى

شاهد النسخة الأصليةرد0

GateUser-cbb8cdf5

· منذ 13 س

شركة في غاية السعادة، أخيرًا لم يعد من الضروري إنفاق المال على التعديلات الدقيقة

شاهد النسخة الأصليةرد0

BribeCoffee

· منذ 13 س

التحسين الذاتي التكراري واستخراج الخبرة، بنية Meta-System هذه لها بعض الاهتمام

شاهد النسخة الأصليةرد0

VineGeometry

· منذ 13 س

الإضافات الخارجية للواجهة البرمجية البحتة يمكنها جعل Kimi يقفز من 50% إلى 79% دون لمس الأوزان، وهذه الطريقة أذكى بكثير من التعديلات الدقيقة.

شاهد النسخة الأصليةرد0

المواضيع الرائجة
عرض المزيد
#
TradfiTradingChallenge
341.74K درجة الشعبية
#
PlatinumCardCreatorExclusive
125.2K درجة الشعبية
#
IsraelStrikesIranBTCPlunges
49.09K درجة الشعبية
#
#DailyPolymarketHotspot
1.05M درجة الشعبية
#
GateSquarePizzaDay
1.79M درجة الشعبية

مُثبت

خريطة الموقع

عدم تعديل الأوزان، ضبط API فقط: Poetiq "إضافة خارجية" تجعل Kimi ترتفع بنسبة 29.9 نقطة مئوية، نسخة خفيفة من Gemini تتفوق على Claude Opus

المواضيع الرائجة

TradfiTradingChallenge

PlatinumCardCreatorExclusive

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

GateSquarePizzaDay

مُثبت