مختبر الذكاء الاصطناعي في ستانفورد يصدر إطار التحقق العام LLM-as-a-Verifier، ويحقق أفضل أداء في معيارين قياسيين

MeNews · 2026-04-10T00:23:19+00:00

مختبر الذكاء الاصطناعي في ستانفورد أصدر إطار التحقق المسمى "LLM-as-a-Verifier" ، وحقق من خلال عدة طرق أعلى دقة حالية في العديد من الاختبارات المعيارية، وهي 86.4٪ و77.8٪ على التوالي. قدمت المقالة روابط للمدونة والكود ذات الصلة.

MeNews

2026-04-10 00:23:19

إنشاء الملخص قيد التقدم

أخبار ME، في 10 أبريل (بتوقيت UTC+8)، أصدرت مختبر الذكاء الاصطناعي بجامعة ستانفورد (StanfordAILab) مؤخرًا إطارًا عامًا للتحقق يُسمى “LLM-as-a-Verifier”. من خلال توسيع دقة التقييم، والتحقق المتكرر، وتحليل المعايير، حقق هذا الإطار دقة بنسبة 86.4٪ في اختبار المعيار Terminal-Bench 2، و77.8٪ في اختبار المعيار SWE-Bench Verified، مما يعكس أعلى مستوى حالي (SOTA). توفر المقالة روابط للمدونة والكود ذات الصلة. (المصدر: InFoQ)

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

تسجيلات الإعجاب 2