Consejos y trucos

Esta sección describe varias formas habituales de crear FlexiLayouts que busquen campos de datos en imágenes de baja calidad. Este tipo de imágenes es bastante común y suele presentar diversos defectos de escaneo causados, en su mayoría, por una configuración de escaneo incorrecta. Por ejemplo, una imagen puede quedar demasiado clara o demasiado oscura si la configuración de brillo no es la adecuada. Como resultado, parte de la información de la imagen puede perderse o algunas zonas pueden contener ruido. No siempre es posible volver a escanear los documentos, y a menudo hay que extraer datos de imágenes dañadas. Además, algunos documentos pueden tener notas escritas a mano sobre información útil, lo que suele provocar errores de reconocimiento.

Cómo afecta el deterioro de la imagen a la calidad del prerreconocimiento

Todos estos tipos de deterioro del texto afectan gravemente a la calidad del prerreconocimiento. La calidad del prerreconocimiento puede mejorarse cambiando el modo de reconocimiento a Accurate. Por desgracia, esto no siempre ayuda y aumenta considerablemente el tiempo de prerreconocimiento.

Cómo los FlexiLayouts toleran un prerreconocimiento inexacto

El usuario puede especificar en el FlexiLayout que los resultados del prerreconocimiento pueden ser inexactos, es decir, diferir del texto original. Esto se refleja en la configuración estándar de un elemento, por ejemplo, en el número máximo de errores de un elemento de tipo texto estático, o en el porcentaje de caracteres no alfabéticos de un elemento cadena de caracteres. En realidad, no se requiere una alta calidad de prerreconocimiento para buscar campos de datos. Sin embargo, sí es necesaria cuando los campos detectados se reconocen en FlexiCapture, que ofrece tipos de datos especializados para cada campo, lo que mejora significativamente la calidad del reconocimiento. El prerreconocimiento en FlexiLayout Studio es un OCR de página completa, y la práctica ha demostrado que esto suele ser suficiente para detectar los campos de datos de un documento.

Extender un FlexiLayout para trabajar con imágenes de baja calidad

En proyectos reales, por lo general basta con crear unos pocos elementos para obtener un FlexiLayout capaz de procesar correctamente imágenes de buena calidad. Cualquier usuario puede crear fácilmente un FlexiLayout que detecte los campos de datos necesarios en aproximadamente el 70 % de las imágenes. Ese FlexiLayout puede utilizarse en FlexiCapture. Un FlexiLayout puede actualizarse y entrenarse para extraer datos de imágenes de baja calidad. El alcance de esa modificación depende de la tarea en cuestión y del tiempo del que disponga el usuario. Modificar un FlexiLayout implica identificar elementos que antes no se detectaban e intentar encontrarlos con elementos adicionales (posiblemente de otro tipo) que tengan restricciones de búsqueda menos estrictas.

Cuando un FlexiLayout sustituye a varias Definiciones de Document

También hay otras situaciones que requieren modificar el FlexiLayout, incluida la creación de elementos adicionales. A menudo, el usuario tiene que procesar documentos similares recibidos de distintas fuentes, por ejemplo, documentos creados en distintas sucursales regionales de una institución gubernamental. Esos documentos, pese a su aparente similitud, pueden diferir en la disposición de los campos de datos. En esos casos, es aconsejable crear un único FlexiLayout en lugar de varias Definiciones de Document de FlexiCapture ligeramente distintas. Los documentos pueden diferir en los tipos de separadores utilizados o pueden estar cumplimentados no solo a mano, sino también con impresora. Para enseñar al FlexiLayout a encontrar esos campos, utilice los métodos descritos en esta sección.

Guías del proyecto de ejemplo

Un proyecto de FlexiLayout Studio que contiene imágenes de prueba y un FlexiLayout ya probado se encuentra en %public%\ABBYY\FlexiCapture\12.0\Samples\FLS\Tips and Tricks. Cada una de las siguientes guías muestra una técnica para resolver un problema de búsqueda habitual:

Función Print para la salida de depuración

Búsqueda de fechas después de un reconocimiento de alta o baja calidad

⌘I

Introducing ABBYY FlexiLayout Studio

Program interface

Projects

Batches

FlexiLayouts

Multi-page FlexiLayout

Pre-recognition

Elements

Blocks

Working with tables

Hypotheses and trees of hypotheses

Debugging the FlexiLayout

Classification

Export

FlexiLayout language

Tips and tricks

Appendix

Tutorial

Cómo afecta el deterioro de la imagen a la calidad del prerreconocimiento

Cómo los FlexiLayouts toleran un prerreconocimiento inexacto

Extender un FlexiLayout para trabajar con imágenes de baja calidad

Cuando un FlexiLayout sustituye a varias Definiciones de Document

Guías del proyecto de ejemplo

​Cómo afecta el deterioro de la imagen a la calidad del prerreconocimiento

​Cómo los FlexiLayouts toleran un prerreconocimiento inexacto

​Extender un FlexiLayout para trabajar con imágenes de baja calidad

​Cuando un FlexiLayout sustituye a varias Definiciones de Document

​Guías del proyecto de ejemplo

Cómo afecta el deterioro de la imagen a la calidad del prerreconocimiento

Cómo los FlexiLayouts toleran un prerreconocimiento inexacto

Extender un FlexiLayout para trabajar con imágenes de baja calidad

Cuando un FlexiLayout sustituye a varias Definiciones de Document

Guías del proyecto de ejemplo