Saltar al contenido principal
El prerreconocimiento es la primera etapa del procesamiento de un documento semiestructurado. A diferencia de los documentos fijos, que están diseñados pensando en el procesamiento informático, los documentos no estructurados tienen una estructura variable y los campos de datos se sitúan en distintas partes de la página. Por esta razón, el prerreconocimiento se utiliza para detectar objetos en el documento que puedan indicar la ubicación de los campos de datos. El prerreconocimiento es la primera etapa del análisis de documentos. Como el prerreconocimiento puede llevar bastante tiempo, FlexiLayout Studio le permite realizarlo una vez de forma independiente del emparejamiento de FlexiLayout, para que pueda concentrarse por completo en crear y probar su FlexiLayout. Sin embargo, debe evaluar la calidad de los resultados del prerreconocimiento antes de empezar a crear su FlexiLayout. La calidad del prerreconocimiento depende de la calidad de las imágenes de prueba del lote. A su vez, la calidad de las imágenes de prueba depende de los parámetros de escaneo, como el brillo, el contraste y la resolución. Si no está satisfecho con la calidad de los resultados del prerreconocimiento, puede que tenga que cambiar las opciones de escaneo y volver a escanear los documentos de prueba. Tenga también en cuenta que FlexiLayout Studio le permite agregar imágenes escaneadas con distintas resoluciones, para que pueda experimentar con el prerreconocimiento y el emparejamiento de FlexiLayout y seleccionar las opciones de escaneo óptimas. El prerreconocimiento puede ejecutarse en modo rápido o completo (consulte Parámetros de prerreconocimiento para obtener más detalles). Cuando se está desarrollando un FlexiLayout, no es necesario que el prerreconocimiento sea perfecto. Siempre hay alguna forma de encontrar prácticamente cualquier campo de datos, incluso si se han producido varios errores de reconocimiento. De hecho, a veces la velocidad del prerreconocimiento es más importante que la calidad: la calidad del reconocimiento puede abordarse en una etapa posterior de una aplicación de captura de datos, donde puede especificar tipos de datos para cada campo, mejorando así considerablemente la calidad del reconocimiento. Durante el prerreconocimiento, el programa analiza la ubicación de puntos de varios colores, detecta objetos básicos y combina fragmentos de texto en palabras y líneas. El programa detecta los siguientes tipos de objeto básico:
  • Texto
  • Imagen
  • Signo de puntuación
  • Texto invertido
  • Separador
  • Código de barras
  • Marca de verificación
Una vez detectados los objetos básicos, el programa empieza a reconocer los objetos de texto. El texto reconocido puede visualizarse en los dos tipos siguientes:
  • Recognized Words
  • Recognized Lines

Más información:

Parámetros de prerreconocimiento Ejecución del prerreconocimiento y visualización de los resultados Análisis de imágenes