Unisound U1-OCR: El primer modelo base de inteligencia documental de grado industrial que inaugura la era OCR 3.0

Este es un comunicado de prensa de pago. Póngase en contacto directamente con el distribuidor del comunicado de prensa para cualquier consulta.

Unisound U1-OCR: El primer modelo base de inteligencia documental de nivel industrial que inaugura la era de la OCR 3.0

PR Newswire

Thu, February 26, 2026 at 11:10 PM GMT+9 3 min read

En este artículo:

9678.HK

+1.93%

Unisound presenta U1-OCR: el primer modelo de inteligencia documental de nivel industrial, inaugurando la era de la OCR 3.0

BEIJING, 26 de feb. de 2026 /PRNewswire/ – Unisound ha lanzado oficialmente su Unisound U1-OCR, el primer modelo base del mundo de nivel industrial para inteligencia documental, un lanzamiento revolucionario que inaugura la era de la OCR 3.0 y marca un nuevo estándar en la industria con cinco fortalezas principales: rendimiento SOTA, resultados verificables, funcionalidad lista para usar, despliegue eficiente y adaptabilidad sólida.

La inteligencia documental aprovecha la IA para leer, comprender, clasificar automáticamente documentos digitalizados y extraer información clave. La OCR 1.0 solo habilitaba el reconocimiento básico de texto, mientras que la OCR 2.0 añadió capacidades preliminares de comprensión del diseño. U1-OCR da un salto cuántico hacia la OCR 3.0, yendo mucho más allá del reconocimiento del diseño para ofrecer una comprensión semántica profunda, clasificación automática de documentos y extracción de información a nivel empresarial—marcando un cambio transformador de la “percepción de caracteres” a la “cognición documental”.

Como modelo de inteligencia documental a nivel SOTA, U1-OCR resuelve el cuello de botella de larga data de los modelos tradicionales que “reconocen texto pero no logran comprender el diseño”, permitiéndole interpretar documentos complejos como lo harían expertos humanos. Pionera una estrategia de “impulsada por la semántica + enfoque dinámico”, mapeando primero la estructura jerárquica de encabezados y metadatos estructurales de un documento antes de extraer contenido bajo demanda, y construye un mapa semántico para identificar la relación entre títulos, gráficos y texto—incluso en diseños desordenados. Su módulo mejorado de alineación espacial aprovecha los datos posicionales para restaurar con precisión la estructura del documento para tablas densas y contenido mixto de texto-imagen, mitigando de manera efectiva los errores de reconocimiento espacial. Equipado con la tecnología de Multi-Token Prediction y con aprendizaje reforzado para tareas completas, impulsa la eficiencia del razonamiento en más de un 80%, asegurando coherencia lógica para documentos largos.

Entrenado con aprendizaje reforzado colaborativo multitarea y optimizado tanto para la semántica como para las coordenadas, U1-OCR suprime las alucinaciones espaciales para obtener resultados fiables y logra resultados SOTA en los principales puntos de referencia autorizados: una puntuación de 95.1 en OmniDocBench V1.5, superando modelos líderes como GLM-OCR y Gemini-3-Pro; alcanzando una puntuación F1 de 90.8 en D4LA y 95.9 en DocLayNet, destacando en reconocimiento de tablas y asociación entre páginas; y superando modelos como Gemini-2.5-Flash y Qwen-2.5-VL en pruebas internas de negocio, con un rendimiento especialmente destacado en el procesamiento de documentos médicos, como registros de admisión y alta.

La historia continúa  

Figura: Comparación de las puntuaciones de evaluación de Unisound U1-OCR en OmniDocBench V1.5 (PRNewsfoto/Unisound)

Diseñado para aplicaciones industriales del mundo real, U1-OCR cuenta con cuatro capacidades clave que cierran la brecha entre la comprensión de documentos y la acción empresarial. Su arquitectura patentada “coordinate-text-semantics” habilita el posicionamiento a nivel de píxel y una trazabilidad completa de la evidencia, haciendo que los procesos de auditoría sean transparentes y eficientes. Integrado con la experiencia de la industria de Unisound en salud y finanzas, logra más de un 99% de precisión en la clasificación para más de 50 documentos comerciales comunes, y respalda la verificación lógica entre campos con capacidades de zero-shot. Admite despliegue privado en las instalaciones y sin conexión, a la vez que ofrece un procesamiento de documentos altamente eficiente, cumpliendo requisitos estrictos de privacidad de datos para los sectores gubernamental, de salud y financiero, al tiempo que reduce los costos de hardware. Lo más notable es que ofrece un rendimiento estable y de alta precisión en escenarios extremos—incluyendo fotos no estándar, documentos borrosos, formateo complejo y texto multilingüe—liberando a las empresas de depender de formatos de documentos estandarizados.

Validado en casos de uso del mundo real, U1-OCR habilita la trazabilidad visual de la información extraída, la clasificación automática de documentos mixtos, realiza una purificación inteligente de imágenes para diseños desordenados y reconoce con precisión tablas anidadas complejas con retención total de la estructura.

El lanzamiento de U1-OCR marca la evolución de la IA desde el simple reconocimiento de texto hacia la comprensión de la lógica empresarial, un paso clave para que Unisound avance hacia la AGI. Al tomar documentos multimodales como punto de entrada de conocimiento, Unisound dota a las máquinas con capacidades de razonamiento autónomo y trazabilidad de evidencia, impulsando la IA desde la inteligencia perceptual hasta la inteligencia cognitiva—con la visión de construir un agente inteligente general que lea, piense y resuelva problemas complejos como los humanos, convirtiendo cada documento en un peldaño hacia la AGI.

Cision

Ver el contenido original para descargar contenido multimedia:

Términos y Política de Privacidad

Privacy Dashboard

Más información

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado