Prerreconocimiento

El prerreconocimiento es la primera etapa del procesamiento de un documento semiestructurado. A diferencia de los documentos fijos, que están diseñados pensando en el procesamiento informático, los documentos no estructurados tienen una estructura variable y los campos de datos se sitúan en distintas partes de la página. Por esta razón, el prerreconocimiento se utiliza para detectar objetos en el documento que puedan indicar la ubicación de los campos de datos. Como el prerreconocimiento puede llevar bastante tiempo, FlexiLayout Studio le permite realizarlo una vez de forma independiente del emparejamiento de FlexiLayout, para que pueda concentrarse por completo en crear y probar su FlexiLayout.

Evaluar la calidad de los resultados del prerreconocimiento

Debe evaluar la calidad de los resultados del prerreconocimiento antes de empezar a crear su FlexiLayout. La calidad del prerreconocimiento depende de la calidad de las imágenes de prueba del lote. A su vez, la calidad de las imágenes de prueba depende de los parámetros de escaneo, como el brillo, el contraste y la resolución. Si no está satisfecho con la calidad de los resultados del prerreconocimiento, puede que tenga que cambiar las opciones de escaneo y volver a escanear los documentos de prueba. Tenga también en cuenta que FlexiLayout Studio le permite agregar imágenes escaneadas con distintas resoluciones, para que pueda experimentar con el prerreconocimiento y el emparejamiento de FlexiLayout y seleccionar las opciones de escaneo óptimas.

Modos de prerreconocimiento

El prerreconocimiento puede ejecutarse en modo rápido o completo. Para obtener más información, consulte Parámetros de prerreconocimiento. Cuando se está desarrollando un FlexiLayout, no es necesario que el prerreconocimiento sea perfecto. Siempre hay alguna forma de encontrar prácticamente cualquier campo de datos, incluso si se han producido varios errores de reconocimiento. De hecho, a veces la velocidad del prerreconocimiento es más importante que la calidad. La calidad del reconocimiento puede abordarse en una etapa posterior de una aplicación de captura de datos, donde puede especificar tipos de datos para cada campo, mejorando así considerablemente la calidad del reconocimiento.

Objetos básicos detectados durante el prerreconocimiento

Durante el prerreconocimiento, FlexiLayout Studio analiza la ubicación de puntos de varios colores, detecta objetos básicos y combina fragmentos de texto en palabras y líneas. Se detectan los siguientes tipos de objetos básicos:

Texto
Imagen
Signo de puntuación
Texto invertido
Separador
Código de barras
Marca de verificación

Una vez detectados los objetos básicos, se reconocen los objetos de texto. El texto reconocido puede visualizarse en los dos tipos siguientes:

Recognized Words
Recognized Lines

Soporte para documentos multipágina en ABBYY FlexiLayout Studio

Parámetros de prerreconocimiento

⌘I

Introducing ABBYY FlexiLayout Studio

Program interface

Projects

Batches

FlexiLayouts

Multi-page FlexiLayout

Pre-recognition

Elements

Blocks

Working with tables

Hypotheses and trees of hypotheses

Debugging the FlexiLayout

Classification

Export

FlexiLayout language

Tips and tricks

Appendix

Tutorial

Evaluar la calidad de los resultados del prerreconocimiento

Modos de prerreconocimiento

Objetos básicos detectados durante el prerreconocimiento

​Evaluar la calidad de los resultados del prerreconocimiento

​Modos de prerreconocimiento

​Objetos básicos detectados durante el prerreconocimiento

​Temas relacionados

Evaluar la calidad de los resultados del prerreconocimiento

Modos de prerreconocimiento

Objetos básicos detectados durante el prerreconocimiento

Temas relacionados