GPT-5 و Gemini انهارا تمامًا أمام النقوش القديمة، وتيك توك تصدر أول معيار تقييم للنصوص القديمة Chronicles-OCR

أخبار ME News، في 18 مايو (بتوقيت UTC+8)، وفقًا لمراقبة 动察 Beating، أطلقت شركة Tencent مع مختبر الثقافة الرقمية 混元 وSSV بالتعاون مع معهد المعلومات والهندسة بجامعة أكسفورد وغيرها من المؤسسات، أول معيار تقييم لوعي النصوص القديمة يغطي "تغيرات السبعة أشكال" وهو Chronicles-OCR.
يحتوي هذا المعيار على 2800 صورة تم وسمها بشكل متقاطع من قبل خبراء، ويقوم لأول مرة بتوحيد قياس صعوبة التعرف على سبعة أنواع من الخطوط من العصور القديمة، من العُبُر إلى الخط الكوفي.
قيم فريق البحث 28 نموذج لغة متعدد الوسائط رائد، وأظهرت النتائج أن أدائها كان ضعيفًا جدًا على الخطوط القديمة.
في مهمة اكتشاف الأحرف عبر العصور، كانت مؤشرات GPT-5 و Gemini 2.5 Pro قريبة من الصفر، وأقوى نموذج لم يتجاوز 16.5.
حتى عند رسم إطارات مباشرة على الصور لتجنب خطوة التحديد، كانت أعلى نسبة دقة فقط 27.1%، وكان دقة Gemini 3.1 Pro على العُبُر فقط 14.0%.
وهذا يثبت أن النماذج الحديثة تعتمد بشكل كبير على فرضية النسق الحديث المنتظم.
في مواجهة وسائط قديمة غير مقيدة وذات ضوضاء عالية، تتعطل آلية تقسيم النصوص في النماذج مباشرة.
تشير نتائج تصنيف الخطوط إلى أن النماذج غالبًا ما تميز أنماط السطح (مثل قشور السلاحف أو الصدأ على البرونز)، وليس الحروف الفعلية.
كما كشفت التجارب عن ظاهرة غير بديهية: أن تفعيل وضع التفكير يؤدي إلى انخفاض معدل التعرف على النصوص القديمة.
مقارنةً، أظهرت جميع النماذج التي تدعم هذا الوضع تراجعًا في الأداء عند تفعيله.
عندما يفتقر النموذج إلى الإدراك البصري الأساسي، فإن سلسلة التفكير لا يمكنها تصحيح الأخطاء، بل تتحول إلى مضخم للأوهام، وتنتج إجابات خاطئة بثقة عالية.
(المصدر: BlockBeats)
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت