مختبر الذكاء الاصطناعي في ستانفورد يصدر إطار التحقق العام LLM-as-a-Verifier، ويحقق أفضل أداء في معيارين قياسيين

MeNews · 2026-04-10T01:01:33+00:00

مختبر الذكاء الاصطناعي في ستانفورد أصدر إطار التحقق المسمى "LLM-as-a-Verifier" ، وحقق من خلال عدة طرق أعلى دقة حالية في اختبارات معيارية متعددة، بنسبة 86.4٪ و77.8٪ على التوالي. توفر المقالة روابط للمدونة والكود ذات الصلة.

MeNews

2026-04-10 01:01:33

إنشاء الملخص قيد التقدم

رسالة ME News، في 10 أبريل (بتوقيت UTC+8)، أصدر مختبر الذكاء الاصطناعي بجامعة ستانفورد (StanfordAILab) مؤخرًا إطار تحقق عام بعنوان “LLM-as-a-Verifier”. يحقق هذا الإطار دقة بنسبة 86.4% في اختبار المعيار Terminal-Bench 2، ودقة بنسبة 77.8% في اختبار المعيار SWE-Bench Verified، وذلك من خلال توسيع دقة التقييم، والتحقق المتكرر، والتحليل/التجزئة إلى معايير قياسية وغيرها من الطرق، وقد وصل جميعها إلى المستوى الأفضل حاليًا (SOTA). يتضمن النص روابط للمدونة والكود ذوي الصلة. (المصدر: InFoQ)

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.