- El modo de reconocimiento (Fast / Balanced / Normal / Accurate) determina la velocidad del reconocimiento y la calidad de la capa de texto obtenida como resultado. Para especificar un modo de reconocimiento, en el Editor de Definición de Document, haga clic en Document Definition → Propiedades de la Definición de Document… → Recognition).
- Los idiomas de reconocimiento son los idiomas que se utilizarán para el reconocimiento. Para especificar los idiomas de reconocimiento, en el Editor de Definición de Document, haga clic en Document Definition → Propiedades de la Definición de Document… → Configuración de la Definición de Document y, a continuación, haga clic en Editar en el grupo Países y lenguas para seleccionar los idiomas requeridos.
En FlexiCapture for Invoices, los idiomas de reconocimiento están vinculados a la configuración del país. Al agregar un país de factura al grupo Países y lenguas, los idiomas correspondientes aparecerán automáticamente en la configuración de la Definición de Document. Los campos de la factura se extraen durante el reconocimiento.
Para detectar y capturar campos en una factura, el programa puede utilizar:
Uso de FlexiLayout
Unidad de negocio y proveedor
Unidad de negocio y proveedor
Los siguientes elementos pueden utilizarse para determinar el Proveedor y la Unidad de Negocio:El programa busca coincidencias exactas en la imagen para dichos campos. Las expresiones regulares también pueden tener en cuenta posibles errores de reconocimiento. Para ello, se utilizan expresiones regulares extendidas (consulte Expresiones regulares extendidas).Los valores detectados se normalizan de la siguiente manera:Es posible que una unidad de negocio no se detecte de manera confiable. En ese caso, el parámetro de registro del documento fc_Predefined:InvoiceIsVendorSuspicious (fc_Predefined:InvoiceIsBusinessUnitSuspicious) se establecerá en true.Las regiones de los siguientes campos pueden encontrarse como resultado de la detección de proveedor y unidad de negocio:Para el proveedor:Un resultado importante de la detección del proveedor y la unidad de negocio es que la información sobre sus respectivos países se recupera del campo CountryCode de los records encontrados en el conjunto de datos. Esta información se utiliza luego para seleccionar palabras clave y tasas impositivas, así como para capturar otros campos de la factura. También se utiliza como condición para activar las Reglas de Validación de la factura.
- Configuración de la Definición de Document: formatos de IBAN, VATID y NationalVATID, así como las Palabras clave correspondientes;
- Conjunto de datos: campos del registro: IBAN, VATID, NationalVATID, Name, Street, City, ZIP.
Algoritmo de detección automática de empresas
El nivel de detalle y la calidad de la información introducida en las columnas del conjunto de datos tienen un impacto significativo en la calidad de la detección. Para garantizar que los resultados de búsqueda sean lo más precisos posible, asegúrese de que:- Se completan los identificadores únicos de la empresa Completar las columnas con valores únicos (VATID, NationalVATID, IBAN) mejorará significativamente la probabilidad de una detección correcta, ya que estos valores son únicos para cada empresa.
- No hay registros duplicados de empresas La ausencia de registros duplicados aumentará la probabilidad de detectar correctamente la empresa. Para obtener más información sobre cómo eliminar registros duplicados, consulte Eliminación de registros duplicados en la base de datos externa.
- No hay registros irrelevantes La presencia de registros obsoletos o no válidos en el conjunto de datos puede provocar una detección incorrecta de la empresa debido a similitudes fortuitas entre distintos valores de campo.
- Todos los campos están completados para cada registro de empresa Especifique tanta información sobre las empresas como sea posible. Cuantos más campos estén completados en el conjunto de datos, mayor será la probabilidad de detectar correctamente la empresa.
- Las columnas multivalor se usan para almacenar la misma información expresada de distintas maneras, no información diferente Por ejemplo, si una misma empresa tiene varias direcciones, debe haber un registro independiente para cada una de ellas, aunque todos los demás campos contengan la misma información. Para obtener más información, consulte la preparación de las bases de datos de proveedores y unidades de negocio.
- Búsqueda por identificador único
- VATID,
- NationalVATID,
- IBAN.
Completar correctamente las palabras clave y los formatos de identificador mejora considerablemente la calidad de detección.
ABBYY FlexiCapture for Invoices ofrece expresiones regulares predefinidas; no obstante, puede crear sus propias expresiones regulares si es necesario. Para ello, vaya al grupo Países y lenguas en la pestaña Configuración de Definición de Document, seleccione el país correspondiente y haga clic en Editar….
- las letras se convierten en mayúsculas,
- se eliminan los espacios y los siguientes caracteres: ” . ”, ” , ”, ” — ”, ” / ”, ” **** ”.
- Búsqueda del nombre de la empresa y la dirección
Para obtener los mejores resultados posibles en la búsqueda de nombres y empresas, asegúrese de que las columns del Data set correspondientes estén completas. El nombre de la empresa y la información de dirección son especialmente importantes en los casos en que la empresa no pueda identificarse mediante VATID, NationalVATID o IBAN.
- Generación de hipótesis
Si solo está conectada la base de datos de proveedores, la calidad de la evaluación del par proveedor-BU puede verse afectada negativamente. Se recomienda conectar una base de datos de unidades de negocio aunque no sea necesaria la detección de unidades de negocio. Para obtener más información, consulte Conexión de bases de datos.
Si el número de unidades de negocio es muy reducido (p. ej., 1), conectar dicha base de datos no tendrá un impacto significativo en la evaluación. Sin embargo, hacerlo puede mejorar la calidad de detección en los casos en que una unidad de negocio se detecte incorrectamente como proveedor.
Filtrado de hipótesis
Las hipótesis se dividen en las siguientes categorías según la fiabilidad de coincidencia (el registro del conjunto de datos y el valor del campo de imagen del documento):- que coinciden de forma fiable con la imagen del documento;
- coinciden de forma poco fiable con la imagen del documento.
- true — el filtrado está activado y la hipótesis final se seleccionará exclusivamente de entre las hipótesis fiables (valor predeterminado);
- false — el filtrado está deshabilitado y la hipótesis final se seleccionará entre todas las hipótesis, independientemente de su fiabilidad;
- Al detectar proveedores, no se tendrán en cuenta las hipótesis poco fiables. Si no hay hipótesis fiables, no se detectará ningún proveedor.
- Al detectar unidades de negocio:
- si se ha encontrado al menos una hipótesis fiable, no se tendrá en cuenta ninguna hipótesis poco fiable;
- si el conjunto de hipótesis obtenido en los pasos del 1 al 3 no contiene al menos una hipótesis fiable, se ignorará el valor del flag. La hipótesis final se seleccionará entre las hipótesis poco fiables.
- Suele haber muchos menos registros de unidades de negocio de la empresa que registros de proveedores. Además, se modifican con mucha menos frecuencia, por lo que es más fácil mantenerlos actualizados. Por lo tanto, detectar una hipótesis fiable aumenta la probabilidad de que la hipótesis final sea correcta. Sin embargo, detectar una unidad de negocio es importante incluso si no se han encontrado hipótesis fiables, ya que el factor más importante para la fiabilidad del resultado de la detección es la evaluación de la fiabilidad de los pares proveedor-BU.
- Suele haber muchos más registros de proveedores, y el conjunto de datos contiene más columnas porque los proveedores especifican más información sobre su propia empresa en sus facturas (a diferencia de la unidad de negocio). Los registros también pueden contener información desactualizada, lo que significa que la fiabilidad del filtrado de hipótesis dependerá tanto de la calidad del conjunto de datos como del tipo de escenario de verificación.
Para mejorar la probabilidad de detectar hipótesis fiables, mantenga los Data sets actualizados e incluya la mayor cantidad de información posible sobre proveedores y unidades de negocio.
Resultados de la detección del proveedor y la unidad de negocio
Los principales resultados de la detección del proveedor y la unidad de negocio en la factura son:- el identificador del registro de proveedor en el conjunto de datos Vendors
- el identificador del registro de la unidad de negocio en el conjunto de datos BusinessUnits
Si el conjunto de datos Vendors especifica que Id depende de BusinessUnitId (consulte conjunto de datos Vendors), el resultado de la detección del proveedor contendrá el Id que corresponde al BusinessUnitId.
- Name
- VatID
- NationalVatID
- IBAN
- Calle
- Código postal
- Ciudad
- Name
- VatID
- Calle
- Código postal
- City
Si los valores de campo para IBAN y VATID no están presentes en el conjunto de datos de Vendors, se pueden usar palabras clave y formato para detectar los valores adecuados de la misma manera en que se detectan los datos bancarios (si se ha encontrado el proveedor correspondiente).
La búsqueda de cualquier región de campo puede modificarse mediante entrenamiento o aplicando un FlexiLayout adicional (consulte Captura de campos de factura adicionales). Esto no tendrá ningún efecto en la detección del proveedor ni de la unidad de negocio, pero puede afectar a la ubicación de las regiones de los campos en estos grupos de campos tras el emparejamiento de la Definición de Document con las facturas.
Cómo cambiar el modo en que el programa detecta el proveedor o la unidad de negocio
Cuanto mejor coincida un registro de proveedor o unidad de negocio en el conjunto de datos con el texto extraído de una imagen de factura, con mayor precisión el programa detectará el proveedor o la unidad de negocio.En primer lugar, debe identificar los datos de la base de datos externa que corresponden a las columnas del conjunto de datos utilizadas para buscar la empresa en una factura. La base de datos externa y el conjunto de datos deben estar correctamente conectados (consulte Uso de bases de datos de proveedores y unidades de negocio).Si una misma empresa aparece tanto en la lista de Vendors como en la lista de unidades de negocio, debe especificar el mismo VATID para los records correspondientes en ambos conjuntos de datos (incluso si no hay VATID en las facturas). Esto evitará que el programa detecte incorrectamente al proveedor y a la unidad de negocio.Para compensar las posibles variaciones en los valores de campo en las imágenes, utilice:- normalización de columnas de conjuntos de datos (consulte Normalización de valores en conjuntos de datos),
- columnas multivalor de un conjunto de datos (consulte Columnas multivalor de un conjunto de datos).
Uso de valores predeterminados de proveedor y unidad de negocio junto con valores extraídos
Grupo de campos del encabezado de la factura
Grupo de campos del encabezado de la factura
InvoiceNumber, InvoiceDate
El encabezado de una factura incluye, entre otros, los campos InvoiceNumber e InvoiceDate.Estos campos se detectan mediante palabras clave especificadas en las propiedades de idioma de la Definición de Document. Primero se detectan el proveedor y la unidad de negocio, lo que proporciona información sobre los países del proveedor y de la unidad de negocio. Los países determinan los idiomas (los idiomas que corresponden a un país se especifican en la Definición de Document). El conjunto de palabras clave para localizar los campos se toma de los países del proveedor y de la unidad de negocio.Puede cambiar la forma en que el programa busca las regiones de los campos editando las palabras clave (consulte Keywords) y usando entrenamiento (consulte Training).¿Cómo determina el programa que un documento es una factura?
FC determina si un documento es una factura al aplicar FlexiLayout.Las condiciones que se enumeran a continuación indican que un documento es una factura. No es necesario que se cumplan todas, pero cada una tiene un peso determinado.- Se detectaron los campos InvoiceNumber e InvoiceDate.
- Se detectaron palabras clave del elemento InvoiceIdentifiers located (consulte Keywords).
- Se detectó un proveedor o una unidad de negocio en el documento.
Grupo de campos Montos
Grupo de campos Montos
FCFORINVOICES captura los siguientes campos de una factura:
La información de la Definición de Document se utiliza para encontrar importes y tasas impositivas:
La suma total de la factura (Total) y la divisa de la factura (Currency) | Sí | Sí |
Impuestos:
| Sí | Sí |
| No | Sí |
Impuesto adicional (AdditionalCosts) | Sí | Sí |
- Tasas de impuestos pagaderos en el país del proveedor (puede especificarlas en la pestaña Tax Rates de las propiedades del país; consulte Country and language settings)
- Palabras clave para las tasas impositivas (puede especificarlas en la pestaña Keywords de las propiedades del idioma. Consulte también Keywords).
- AmountTotalHighConfidenceLabels: palabras clave que solo aparecen cerca del campo Total, como “Pay this amount.”
- AmountTotalLowConfidenceLabels: palabras clave que pueden aparecer cerca del campo Total, pero también cerca de otros campos. Por ejemplo, la palabra clave “Total” puede aparecer cerca del campo Total, pero también puede aparecer cerca de un campo que contiene el peso total de todos los artículos de una factura.
- Números que aparecen dos o tres veces en la misma línea o en la misma columna de la imagen. Dichos números pueden ser el Total en facturas en las que no se especifican impuestos.
- Números que son la suma de los números ubicados encima de ellos en la misma columna.
- Los números más grandes (por valor absoluto) ubicados al final del documento.
grupo de campos de la orden de compra
grupo de campos de la orden de compra
FCFORINVOICES puede extraer todos los números de orden de compra y sus importes correspondientes de la factura.Esta función está deshabilitada de forma predeterminada (consulte Purchase order matching).Para extraer números de Orden de compra, necesitará un conjunto de datos con una lista de posibles números de Orden de compra y sus importes (consulte PurchaseOrders data set).El campo Orden de compra se puede extraer mediante:Para obtener más información sobre los archivos de configuración XML, consulte Editing invoice processing settings in XML files.
- una expresión regular;
- un conjunto de datos que contenga posibles números de orden de compra (consulte PurchaseOrders data set).
- Use la columna VendorId del conjunto de datos. En este caso, el programa solo usará números de Orden de compra del proveedor de la factura.
- Filtre las órdenes de compra para las que ya se haya recibido una factura y agregue al conjunto de datos solo los números de las órdenes de compra para las que aún no se haya recibido ninguna factura.
El grupo de campos Partidas
El grupo de campos Partidas
FCFORINVOICES puede extraer las partidas de la factura de las imágenes.La extracción de partidas de factura está deshabilitada de forma predeterminada (consulte Additional fields).Para obtener una lista de los campos que el programa extrae automáticamente, consulte Captured fields.FCFORINVOICES primero busca una tabla en la imagen. Durante esta búsqueda, usa las palabras clave de los títulos de las columnas que se especifican para cada idioma en las propiedades de la Definición de Document. Las palabras clave de las columnas de las partidas de la factura también se usan para clasificar elementos, es decir, para determinar el tipo de cada columna de partida de factura.Después de esto, el programa usa información sobre las columnas detectadas y expresiones matemáticas para encontrar partidas de factura en la tabla de la factura.Por último, el programa busca campos de las columnas en las partidas de la factura.El entrenamiento se puede usar para mejorar la calidad de la extracción automática de partidas.
Uso de redes neuronales
Una de las principales ventajas que ofrecen las redes neuronales es su capacidad de autoaprendizaje: pueden detectar dependencias complejas entre los datos de entrada y establecer generalizaciones útiles. El programa incluye dos redes neuronales que se pueden usar para capturar los siguientes campos:- InvoiceNumber
- InvoiceDate
- Total
- Proveedor \ Nombre
- Proveedor \ Dirección
- Unidad de negocio \ Nombre
- Unidad de negocio \ Dirección
- Órdenes de compra \ Número de pedido
- LineItems:
- OrderNumber
- OrderDate
- Position
- ArticleNumber
- Description
- Quantity
- Unidad de medida
- Unit Price
- Total Price Netto
- VATPercentage
Desactivar las redes neuronales
- Abra el Editor de Definición de Document.
- Haga clic en Propiedades de la Definición de Document… → Configuración de la Definición de Document → Campos y características adicionales.
- Desactive la opción Extracción exhaustiva de las partidas de la factura.
- Abra el Editor de Definición de Document.
- Haga clic en Propiedades de la Definición de Document… → Configuración de la Definición de Document → Campos y características adicionales.
- Desactive la opción Extracción exhaustiva de los campos del encabezado de la factura.
Combinación de los resultados de detección de campos
La forma en que el programa combina los resultados de detección de campos o selecciona el mejor resultado depende del campo. Como regla general, se dará prioridad a los resultados obtenidos por la red neuronal correspondiente. Las excepciones a esta regla son las búsquedas basadas en conjuntos de datos y las búsquedas que utilizan expresiones regulares creadas para documentos específicos del cliente. grupo de campos del encabezado de la factura Los resultados obtenidos por la red neuronal siempre tendrán prioridad para los siguientes campos:- Número de factura
- Fecha de la factura
- Total
- Nombre
- VATID (ABN)
- Dirección
