Saltar al contenido principal
Cuándo usar la clasificación basada en empresa La clasificación asigna cada documento a una clase concreta (consulte la sección Classification para obtener más información). Cada empresa emisora puede tratarse como una clase independiente. Por lo general, los documentos procedentes de una misma empresa tendrán un aspecto similar y contendrán los mismos tipos de campos en las mismas posiciones, lo que facilita la extracción de datos. Los documentos pueden clasificarse mediante una base de datos de empresas. Esta base de datos debe incluirse en el proyecto correspondiente de ABBYY FlexiCapture. Para rellenarla, puede usar la lista de empresas almacenada en su sistema ERP. ABBYY FlexiCapture sincronizará periódicamente la base de datos de empresas con los datos más recientes de su sistema ERP. Si todavía no tiene una base de datos de empresas, puede crearla mientras captura datos de documentos, añadiendo empresas a una base de datos en la etapa de verificación de documentos. El programa buscará los campos necesarios solo en la primera y en la última página de cada documento, ya que la información de la empresa suele encontrarse en esas páginas. La clasificación basada en empresa presenta las siguientes ventajas frente a otros métodos de clasificación:
  • No es necesario recopilar imágenes de muestra de documentos para crear un conjunto de entrenamiento, lo que puede requerir mucho tiempo y esfuerzo.
  • Los documentos pueden clasificarse en hasta 100.000 clases, una cifra muy superior a la de la clasificación basada en imágenes y texto.
La clasificación basada en empresa puede utilizarse para la extracción de campos. Cada empresa tendrá su propia variante de sección, para la cual puede entrenar o crear un FlexiLayout independiente.
Dentro de un proyecto, pueden usarse simultáneamente los siguientes elementos:
  • un clasificador de tipo de documento a nivel de tipo de lote o de proyecto
  • un clasificador basado en empresas para documentos del mismo tipo en el nivel de Definición de Document
Primero, el programa ejecutará el clasificador de tipo de documento para determinar la clase de los documentos en cuestión y, después, ejecutará el clasificador basado en empresas para los documentos de la clase requerida. Las variantes de documento que el clasificador detecta a partir de la base de datos de empresas identifican de forma unívoca los FlexiLayouts entrenados que se utilizarán para el entrenamiento. Esto significa que el entrenamiento de campos se llevará a cabo de forma independiente para cada empresa. Configuración de la clasificación basada en empresa La clasificación basada en empresa se realiza dentro de una Definición de Document, es decir, para documentos del mismo tipo. Los documentos del mismo tipo tienen conjuntos idénticos de campos de datos que deben extraerse (consulte la sección Document Definitions para obtener más información). Para clasificar documentos mediante una base de datos de empresas:
  1. Haga clic con el botón derecho en una sección de documento y haga clic en Propiedades o abra el editor de Definición de Document y haga clic en Document Definition → Propiedades de Definición de Document.
  2. En la pestaña Data Sets, seleccione un conjunto de datos de la lista y haga clic en el botón Set Up….
  3. Seleccione la opción Use database of companies. De forma predeterminada, las columnas necesarias y sus tipos ya están especificados en el conjunto de datos. (Un conjunto de datos es básicamente una tabla que contiene una lista de campos donde buscar empresas; los usuarios no pueden modificar esta tabla).
  4. Para conectar el conjunto de datos a una base de datos compatible con ODBC, debe asignar cada campo del conjunto de datos a su equivalente en la base de datos. Para obtener instrucciones detalladas, consulte Using vendor and business unit databases. Nota: El programa buscará empresas cuyos campos del conjunto de datos se hayan asignado a los campos correspondientes de la base de datos. Debe asignar al menos un campo (por ejemplo, el nombre de la empresa). Si un campo del conjunto de datos no tiene un campo correspondiente en la base de datos, especifique None al asignarlo. Nota: Solo se utilizan ciertos campos para buscar información de la empresa en un documento. Estos campos tienen un pequeño icono de candado junto a ellos. Puede añadir sus propios campos personalizados al configurar la clasificación basada en empresa, pero estos campos solo se utilizarán para mostrar información.
  5. Para buscar nombres de empresas que tengan más de una variante, use la normalización, un proceso que reduce todas las variantes del nombre a un nombre estándar. En el cuadro de diálogo Data Set Column Mapping, especifique el tipo de normalización necesario en el campo Normalization (consulte Normalization of values in data sets para obtener más información).
A veces, el nombre de una empresa puede conocerse de antemano; por ejemplo, a partir de los parámetros del origen de datos (es decir, el nombre del operador de escaneo o la dirección de correo electrónico del remitente). ABBYY FlexiCapture dispone de una función que permite especificar explícitamente el proveedor y la subdivisión de la empresa antes de la detección automática. Para especificar explícitamente las subdivisiones, establezca el valor del parámetro de registro de documento fc_Predefined:PredefinedSectionVariantId como el identificador (Id) de la entrada correspondiente en el Dataset. En este caso, se seguirá ejecutando el procedimiento automático de detección de compañías para la entrada indicada. Como resultado, obtendrá el nombre de la compañía especificado explícitamente y un valor de confianza que indica en qué medida ese nombre coincide con el nombre extraído de una imagen.
Este método solo puede usarse si solo una sección de un documento tiene varias variantes.
Comprobación y edición de los resultados de la clasificación basada en empresa No se requiere entrenamiento para clasificar documentos mediante una base de datos de empresa, ya que el programa buscará las compañías en una lista predefinida de nombres de compañías. Los errores de clasificación pueden corregirlos los operadores. Siempre que el programa atribuya un documento a la compañía incorrecta, el operador puede seleccionar el nombre correcto de la compañía y guardarlo en la base de datos. Después, el programa usará esta información correcta en clasificaciones futuras. Para permitir que el operador corrija errores de clasificación, debe mostrar los resultados de la clasificación en el formulario de datos y agregar un botón que inicie la búsqueda de campos. Para ello, complete los siguientes pasos:
  1. Cree un campo de servicio.
    • En el editor de Definición de Document, haga clic en Create Field → Service Field. Después, en las propiedades del campo, haga clic en la pestaña Data Source y seleccione Flexible Section Variant ID en la lista Source.
    • Cree todos los campos de servicio necesarios para identificar la compañía (por ejemplo, IBAN y VATID).
  2. Cree una regla de comprobación de base de datos:
    • Haga clic con el botón derecho en el grupo, haga clic en Properties…, abra la pestaña Rules y, a continuación, haga clic en el botón New Rule…
    • Seleccione Database Check de la lista y haga clic en OK.
    • En Data source field, seleccione Data Sets.** Luego, en el campo Data Sets, seleccione el conjunto de datos necesario.
    • En el campo Field where to save record ID, seleccione el campo de servicio que creó en el paso 1.
    • Haga clic en el botón Add y especifique los campos necesarios del documento y de la base de datos. Si los valores de los campos del documento y de la base de datos son distintos, seleccione las opciones de buscar y reemplazar (Enter value from database → If values are different).
Ahora, cualquier campo detectado por el clasificador con fines de clasificación basada en empresa tendrá una región.
  1. Agregue un botón al formulario de datos que abra el cuadro de diálogo Look up:
    • Haga clic con el botón derecho en cualquier parte del formulario de datos donde quiera colocar el botón y haga clic en Insert Button en el menú contextual.
    • En la pestaña Format, seleccione la regla de comprobación de base de datos que creó en el paso 2.
    • En la pestaña Position, especifique un nombre para el botón.
Ahora, un operador de verificación podrá hacer clic en este botón del formulario de datos para abrir el cuadro de diálogo Look up. Mejora de la clasificación basada en empresa Especificación de palabras clave y expresiones regulares Puede especificar palabras clave y expresiones regulares para mejorar la detección de compañías. Para las palabras clave, use cadenas que identifiquen de forma inequívoca a una compañía, como los datos de los campos VATID o IBAN. Edición de registros de compañías Otra forma de mejorar la detección de compañías es editar los registros de compañías almacenados por ABBYY FlexiCapture. Para cada compañía, se pueden especificar varias variantes de nombre y direcciones. Esto puede hacerlo el administrador mediante el editor de Definición de Document o un operador de verificación. Tenga en cuenta que solo se modificarán los registros de compañías almacenados por ABBYY FlexiCapture. Incluso si está habilitada la sincronización con una base de datos externa (por ejemplo, un sistema ERP), los cambios realizados por el administrador o por los operadores de verificación no se transferirán a la base de datos externa. Los operadores pueden agregar nuevos registros y editar registros existentes si la Definición de Document lo permite. De forma predeterminada, los operadores no pueden agregar ni editar registros. Para permitir que los operadores agreguen y editen registros:
  1. En el editor de Definición de Document, haga clic en Document Definition → Propiedades de Definición de Document….
  2. En el cuadro de diálogo que se abre, haga clic en la pestaña Data Sets.
  3. Seleccione un conjunto de datos de la lista y haga clic en el botón Set Up…
  4. Seleccione las opciones Operators can add records y Operators can edit records.
Para impedir que los operadores agreguen y editen registros, desactive las dos opciones anteriores.