GPT-5 та Gemini зазнали поразки перед Oracle, Tencent випустила перший тестовий базовий показник стародавніх текстів Chronicles-OCR

ME Новини повідомляють, 18 травня (UTC+8), згідно з моніторингом Бітінг Чек, Tencent Hunyuan та лабораторія цифрової культури SSV у співпраці з Інститутом інформаційних технологій Китайської академії наук офіційно запустили перший у світі стандарт оцінки сприйняття давніх ієрогліфів, що охоплює «семи тіл змін» — Chronicles-OCR.
Цей стандарт містить 2800 зображень, аннотованих експертами, і вперше кількісно уніфікує рівень складності розпізнавання семи шрифтів від орігінальних керамічних написів до каліграфії 草書.
Команда дослідників протестувала 28 провідних мультимодальних великих мовних моделей, і результати показали їх майже повну неспроможність у розпізнаванні стародавніх шрифтів.
У міжчасовій задачі виявлення символів, основні показники GPT-5 і Gemini 2.5 Pro наблизилися до 0, найкраща модель показала лише 16.5.
Навіть при простому малюванні рамки навколо зображення без етапу локалізації, максимальна точність становила лише 27.1%, причому Gemini 3.1 Pro на орігінальних керамічних написах досягла лише 14.0%.
Це підтверджує, що сучасні моделі сильно залежать від регулярних сучасних форматних передумов.
У випадках без обмежень і з високим рівнем шуму у стародавніх фізичних носіях, механізми сегментації тексту моделей безпосередньо виходять з ладу.
Результати класифікації шрифтів додатково показують, що моделі часто розпізнають текстуру носія (наприклад, черепашачий панцир або бронзову іржу), а не справжні штрихи символів.
Експерименти також виявили парадоксальний феномен: активація режиму роздумів навпаки знижує точність розпізнавання давніх ієрогліфів.
Порівняльний аналіз показує, що майже всі моделі з підтримкою цього режиму демонструють деградацію продуктивності після його активації.
Коли базове візуальне сприйняття відсутнє, ланцюг мислення не може виправити помилки і навіть перетворюється на інструмент посилення галюцинацій, видаючи впевнені неправильні відповіді.
(Джерело: BlockBeats)
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено