GPT-5 и Gemini потерпели полное поражение перед оракулом, Tencent выпустила первый тестовый стандарт древних текстов Chronicles-OCR

ME News Новости, 18 мая (UTC+8), согласно мониторингу 动察 Beating, Tencent Hunyuan и лаборатория цифровой культуры SSV совместно с Институтом информационных технологий Китайской академии наук и другими организациями официально запустили первый в мире эталон оценки восприятия древних иероглифов, охватывающий «семь видов изменений» — Chronicles-OCR. Этот эталон включает 2800 изображений, аннотированных экспертами, впервые количественно унифицировал сложность распознавания семи шрифтов: от орхографических до курсивных. Исследовательская команда протестировала 28 популярных мультимодальных больших языковых моделей, результаты показали их почти полное проваливание на древних шрифтах. В задаче межэпохного обнаружения символов показатели GPT-5 и Gemini 2.5 Pro близки к нулю, даже наиболее сильная модель достигла всего 16.5. Даже при простом обведении рамкой без этапа локализации точность не превышает 27.1%, при этом Gemini 3.1 Pro на орхографических символах показывает всего 14.0%. Это подтверждает, что современные модели сильно зависят от регулярных современных форматных приоритетов. В условиях неограниченных и сильно зашумленных древних физических носителей механизмы сегментации текста полностью выходят из строя. Результаты классификации шрифтов дополнительно показывают, что модели зачастую распознают текстуры носителя (например, панцирь черепахи или окислы бронзы), а не реальные штрихи символов. Эксперименты также выявили парадоксальный эффект: включение режима размышлений наоборот снижает точность распознавания древних иероглифов. В сравнении показано, что почти все модели, поддерживающие этот режим, демонстрируют ухудшение результатов после его активации. При отсутствии базового визуального восприятия цепочка мышления не только не исправляет ошибки, но и усиливает иллюзии, выдавая уверенные ошибочные ответы. (Источник: BlockBeats)
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено