GPT-5 y Gemini fracasan completamente frente a los caracteres de oracle, Tencent lanza el primer estándar de evaluación de escritura antigua Chronicles-OCR

ME News Noticias, 18 de mayo (UTC+8), según la monitorización de Beating, Tencent Hun Yuan y el Laboratorio de Cultura Digital SSV en colaboración con la Academia de Ciencias de China, Instituto de Información y Tecnología, lanzaron oficialmente el primer estándar de evaluación de percepción de caracteres antiguos que cubre "Las siete transformaciones del cuerpo" Chronicles-OCR.
Este estándar incluye 2800 imágenes anotadas de forma cruzada por expertos, cuantificando por primera vez la dificultad de reconocimiento de siete estilos de escritura, desde inscripciones en huesos oraculares hasta caligrafía cursiva.
El equipo de investigación evaluó 28 modelos de lenguaje multimodal de gran escala, y los resultados mostraron que casi todos fracasaron en los caracteres antiguos.
En tareas de detección de caracteres de época, GPT-5 y Gemini 2.5 Pro tuvieron indicadores cercanos a 0, siendo los modelos más fuertes solo con un 16.5.
Incluso al dibujar cuadros directamente en la imagen sin la etapa de localización, la precisión máxima fue solo del 27.1%, y Gemini 3.1 Pro en inscripciones en huesos oraculares alcanzó solo un 14.0%.
Esto confirma que los modelos modernos dependen en gran medida de suposiciones previas sobre el formato moderno regular.
Frente a medios físicos antiguos sin restricciones y con fuerte ruido, los mecanismos de segmentación de texto del modelo fallan directamente.
Los resultados de clasificación de fuentes indican que los modelos suelen reconocer la textura del soporte (como caparazones de tortuga o óxido de bronce), en lugar de los trazos reales de los caracteres.
Los experimentos también revelaron un fenómeno contraintuitivo: activar el modo de pensamiento en realidad reduce la tasa de reconocimiento de caracteres antiguos.
La comparación muestra que casi todos los modelos que soportan este modo muestran un rendimiento deteriorado al activarlo.
Cuando falta percepción visual básica, la cadena de pensamiento no solo no corrige errores, sino que también amplifica las alucinaciones, produciendo respuestas erróneas con alta confianza.
(Fuente: BlockBeats)
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado