Especificar varios valores de texto estático para variantes de nombres de campo

Para detectar varios títulos de documentos, tablas, campos o cualquier texto presente en todas o en la mayoría de las imágenes de un documento, FlexiLayout Studio utiliza un elemento especial de texto estático. Si distintas imágenes procesadas por el mismo FlexiLayout tienen diferentes variantes de un mismo nombre (por ejemplo, el campo ‘Número de factura’ tiene las variantes ‘Factura’, ‘Factura:’ y ‘Núm. de factura’), debe especificar todos los valores posibles de texto estático, aunque solo difieran en los signos de puntuación.

Por qué debe enumerarse cada variante de texto estático

Esto es necesario por las siguientes razones:

Para generar una hipótesis correspondiente al valor especificado. Por ejemplo, si no especifica la variante Factura: y solo la variante Factura, los dos puntos no se incluirán en la hipótesis del nombre del campo. Entonces podrían quedar incluidos en el área de búsqueda del número de factura, que se busca a la derecha del nombre. Si la búsqueda del número permite caracteres no numéricos o no especificados, los dos puntos pueden acabar en la hipótesis del elemento que describe el número de factura.
Para evitar penalizar una hipótesis por caracteres no especificados en la ventana Texto a buscar. Por ejemplo, si el valor Factura: se especifica en la sección Texto a buscar y el nombre Factura# también aparece en las imágenes procesadas, entonces, siempre que se permitan algunos errores para el elemento, se seguirá generando una hipótesis, pero su calidad se penalizará (en este ejemplo, el FlexiLayout permite al menos un error).
Si hay hipótesis variantes disponibles, por ejemplo, Factura|Factura:, FlexiLayout Studio asignará a la hipótesis más larga una calidad ligeramente superior, de modo que la hipótesis Factura: será la preferida. Si se especifica una variante con dos puntos, la que no los tenga será penalizada en 0.001, porque la cadena Factura es una subcadena de Factura:. Penalizar la cadena más corta del nombre, que es una subcadena de la otra, hace que la hipótesis más larga sea la ganadora.

El proyecto de ejemplo StaticText.fsp

Usemos el proyecto de ejemplo StaticText.fsp (carpeta %public%\ABBYY\FlexiCapture\12.0\Samples\FLS\Tips and Tricks\Variants of StaticText) para ver cómo especificar los valores de un elemento de texto estático ayuda a detectar el nombre del campo Número de factura y el propio campo. El proyecto tiene cinco páginas, cada una de las cuales muestra una variante del nombre del campo Número de factura.

Página	Nombre del campo Número de factura
Página 1	FACTURA
Página 2	Factura:
Página 3	Factura #:
Página 4	Factura -
Página 5	Factura: (la página también contiene un campo Fecha de la factura, en el que aparece la palabra Factura)

Especifique todas las variantes del nombre en el elemento InvoiceHeader

En el cuadro de diálogo de Propiedades del elemento de texto estático llamado InvoiceHeader, hemos especificado todos los nombres posibles del campo que puede encontrarse en los documentos procesados. En este caso, son los valores mencionados anteriormente. El uso de mayúsculas y minúsculas en los nombres es irrelevante para la búsqueda: Factura|Factura:|Factura#:|Factura-.

Para acelerar la búsqueda del elemento, todas las variantes se escriben sin espacios. La ausencia o presencia de espacios no influye en la calidad de una hipótesis.

Por simplicidad, supongamos que el número de factura siempre se encuentra a la derecha del nombre. Para buscar el número de factura, se ha creado un elemento de cadena de caracteres llamado InvoiceNumber. Su alfabeto y sus restricciones de búsqueda se especifican en el campo Relations. Esta configuración es sencilla y no se describe aquí. Puede consultarla directamente en el proyecto. Se ha creado un bloque de texto Factura en el árbol de FlexiLayout. El elemento InvoiceNumber se ha especificado como Source element para el bloque. Como puede ver después de ejecutar el procedimiento de análisis, el nombre del campo y el número de factura pueden detectarse correctamente en todas las páginas.

Elimine todos los valores excepto Factura y vuelva a hacer el emparejamiento

Ahora intente eliminar temporalmente todos los valores de texto estático excepto el primero (Factura) del elemento InvoiceHeader y, a continuación, vuelva a intentar emparejar el FlexiLayout con todas las páginas. Verá que el nombre y el número de factura se detectaron correctamente solo en la página 1, porque allí el nombre coincide por completo con el valor especificado (Factura). En las páginas 2-4, una parte del nombre pasó al número de factura. En la página 5, hubo un error al localizar el campo del número.

Captura de pantalla de los resultados del emparejamiento de FlexiLayout en ABBYY FlexiLayout Studio después de eliminar todos los valores de texto estático excepto el primero, que muestra que el nombre del campo y el número de factura se detectan correctamente solo en la página cuyo nombre coincide por completo con el valor Factura.

Restaure los valores y compare las hipótesis de la página 5

Ahora restaure los valores eliminados y observe los resultados del análisis en la página 5, donde la palabra Factura aparece dos veces. Como puede ver, FlexiLayout Studio generó cinco hipótesis para el elemento InvoiceHeader. La calidad más alta (calidad de la cadena = 1, que, en este caso, es igual a la calidad de prebúsqueda) se asigna a la hipótesis correspondiente al nombre Factura:. También se generaron hipótesis para los valores Factura y Factura d, porque estas cadenas derivan de los valores especificados para el elemento InvoiceHeader, para el cual se permite un cierto porcentaje de errores. Estas hipótesis fueron penalizadas por las razones descritas anteriormente en esta página, por lo que su calidad final es menor.

Captura de pantalla de los resultados del análisis de la página 5 en ABBYY FlexiLayout Studio, que muestra las cinco hipótesis generadas para el elemento InvoiceHeader con sus valores de calidad de la cadena después de restaurar todos los valores de texto estático.

Búsqueda de fechas después de un reconocimiento de alta o baja calidad

Excluir regiones de un área de búsqueda

⌘I

Introducing ABBYY FlexiLayout Studio

Program interface

Projects

Batches

FlexiLayouts

Multi-page FlexiLayout

Pre-recognition

Elements

Blocks

Working with tables

Hypotheses and trees of hypotheses

Debugging the FlexiLayout

Classification

Export

FlexiLayout language

Tips and tricks

Appendix

Tutorial

Especificar varios valores de texto estático para variantes de nombres de campo

Por qué debe enumerarse cada variante de texto estático

El proyecto de ejemplo StaticText.fsp

Especifique todas las variantes del nombre en el elemento InvoiceHeader

Elimine todos los valores excepto Factura y vuelva a hacer el emparejamiento

Restaure los valores y compare las hipótesis de la página 5

​Por qué debe enumerarse cada variante de texto estático

​El proyecto de ejemplo StaticText.fsp

​Especifique todas las variantes del nombre en el elemento InvoiceHeader

​Elimine todos los valores excepto Factura y vuelva a hacer el emparejamiento

​Restaure los valores y compare las hipótesis de la página 5

Por qué debe enumerarse cada variante de texto estático

El proyecto de ejemplo StaticText.fsp

Especifique todas las variantes del nombre en el elemento InvoiceHeader

Elimine todos los valores excepto Factura y vuelva a hacer el emparejamiento

Restaure los valores y compare las hipótesis de la página 5