ME Новини повідомляють, 18 травня (UTC+8), згідно з моніторингом Бітінг Чек, Tencent Hunyuan та лабораторія цифрової культури SSV у співпраці з Інститутом інформаційних технологій Китайської академії наук офіційно запустили перший у світі стандарт оцінки сприйняття давніх ієрогліфів, що охоплює «семи тіл змін» — Chronicles-OCR.
Цей стандарт містить 2800 зображень, аннотованих експертами, і вперше кількісно уніфікує рівень складності розпізнавання семи шрифтів від орігінальних керамічних написів до каліграфії 草書.
Команда дослідників протестувала 28 провідних мультимодальних великих мовних моделей, і результати показали їх майже повну неспроможність у розпізнаванні стародавніх шрифтів.
У міжчасовій задачі виявлення символів, основні показники GPT-5 і Gemini 2.5 Pro наблизилися до 0, найкраща модель показала лише 16.5.
Навіть при простому малюванні рамки навколо зображення без етапу локалізації, максимальна точність становила лише 27.1%, причому Gemini 3.1 Pro на орігінальних керамічних написах досягла лише 14.0%.
Це підтверджує, що сучасні моделі сильно залежать від регулярних сучасних форматних передумов.
У випадках без обмежень і з високим рівнем шуму у стародавніх фізичних носіях, механізми сегментації тексту моделей безпосередньо виходять з ладу.
Результати класифікації шрифтів додатково показують, що моделі часто розпізнають текстуру носія (наприклад, черепашачий панцир або бронзову іржу), а не справжні штрихи символів.
Експерименти також виявили парадоксальний феномен: активація режиму роздумів навпаки знижує точність розпізнавання давніх ієрогліфів.
Порівняльний аналіз показує, що майже всі моделі з підтримкою цього режиму демонструють деградацію продуктивності після його активації.
Коли базове візуальне сприйняття відсутнє, ланцюг мислення не може виправити помилки і навіть перетворюється на інструмент посилення галюцинацій, видаючи впевнені неправильні відповіді.
(Джерело: BlockBeats)

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

Нагородити
подобається
Прокоментувати
Репост
Поділіться

Прокоментувати

Додати коментар

Немає коментарів

Популярні теми
Дізнатися більше
#
MyGateTradeStory
177,46K Популярність
#
TradFiCFDGoldMaster
2M Популярність
#
IsraelStrikesIranBTCPlunges
57,65K Популярність
#
PredictWorldCup🇺🇸vs🇵🇾
779,72K Популярність
#
MarvellSurgesOver11%LeadingChipSectorWithAI
5,73M Популярність

Закріплено

карта сайту

GPT-5 та Gemini зазнали поразки перед Oracle, Tencent випустила перший тестовий базовий показник стародавніх текстів Chronicles-OCR

Популярні теми

MyGateTradeStory

TradFiCFDGoldMaster

IsraelStrikesIranBTCPlunges

PredictWorldCup🇺🇸vs🇵🇾

MarvellSurgesOver11%LeadingChipSectorWithAI

Закріплено