فريق بيركلي يعلن عن اختراق 8 معايير تقييم رئيسية للذكاء الاصطناعي وفتح أدوات المصدر المفتوح

أخبار ME، 19 أبريل (بتوقيت UTC+8)، نقلت مجموعة أبحاث الذكاء الاصطناعي بجامعة بيركلي (berkeley_ai) بيان داون سونغ، معلنة أن فريقها نجح في اختراق 8 معايير تقييم رئيسية للذكاء الاصطناعي. قرر الفريق إصدار الأدوات المستخدمة لتحقيق هذا الإنجاز كمصدر مفتوح وأطلق عليها اسم BenchJack. وُصف هذا الأداة بأنها "اختبار اختراق موجه للتقييم"، وتهدف إلى مساعدة المطورين الآخرين على اختبار واكتشاف الثغرات المحتملة في أنظمة التقييم الخاصة بهم. (المصدر: InFoQ)
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 7
  • 2
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
GateUser-46033407
· منذ 3 س
دون سونغ قوية حقًا في مجال التقاطع بين الأمن والذكاء الاصطناعي، وهذه المرة أصابت الهدف بدقة.
شاهد النسخة الأصليةرد0
GateUser-f2d5f4c0
· منذ 4 س
الأدوات مفتوحة المصدر أكثر قيمة من الأوراق البحثية، على الأقل تتيح للجميع التحقق من مدى موثوقية المقاييس المقارنة.
شاهد النسخة الأصليةرد0
ThePatienceRequiredFor
· منذ 4 س
8 معايير رئيسية تم كسرها جميعًا، أشعر أن الحصن المنيع لتقييم الوكيل الآن أضعف مما كنت أتصور
شاهد النسخة الأصليةرد0
GovernanceVotingTug-Of-WarKing
· منذ 4 س
مفهوم اختبار الاختراق الخاص بالتقييم جديد نسبياً، ففي السابق كان يتم اختبار النموذج، الآن يتم اختبار أسئلة الاختبار نفسها
شاهد النسخة الأصليةرد0
NeonIceMelt
· منذ 4 س
فريق Dawn Song هذه الحركة جدًا بيركلي، أولاً يهاجم ثم يفتح المصدر، نمط كلاسيكي من هاكر أكاديمي.
شاهد النسخة الأصليةرد0
DustyAlpha
· منذ 4 س
berkeley_ai يضرب بقوة، أتطلع لرؤية كيف يتجاوز هذه التقييمات بالتحديد
شاهد النسخة الأصليةرد0
Wax-SealedPrivateKey
· منذ 4 س
BenchJack هذه الاسم له معنى، ونظام التقييم يحتاج أيضًا إلى اختبار اختراق خاص به.
شاهد النسخة الأصليةرد0
  • مُثبت