Saltar al contenido principal
Los documentos de algunas empresas pueden tener estructuras especialmente complejas. Para extraer datos de estos documentos correctamente, debe configurar actividades de extracción específicas por empresa. Esto puede hacerse dentro de una única Skill de documento utilizando la actividad Clasificar por actividad de empresa. Esta actividad clasifica documentos por empresa utilizando catálogos de datos.

Uso de catálogos de datos

Un catálogo de datos es un conjunto de datos que contiene información específica. Por ejemplo, puede incluir información relacionada con la empresa, como nombres de empresas, direcciones, números de cuenta bancaria, etc. Los catálogos de datos se pueden usar para buscar cualquier empresa en el documento, como proveedores, destinatarios, bancos, navieras, etc. Un catálogo de datos se puede poblar con datos de un archivo CSV cuya estructura sea idéntica a la del propio catálogo. Para obtener más información sobre el uso de catálogos de datos, consulte la sección Using data catalogs en la Skill Designer Guide. Cuando los documentos se procesan mediante una actividad Classify By Company, se buscan datos específicos de la empresa en el catálogo de datos conectado. El resultado es un identificador único de la empresa que se registra en el campo correspondiente de la skill. Este identificador de la empresa luego se utiliza para configurar un algoritmo de procesamiento de documentos específico de la empresa. El identificador de la empresa es el único campo requerido para que una actividad Classify By Company funcione; sin embargo, puede completar más campos usando la información sobre la empresa almacenada en el catálogo de datos para evitar configurar actividades de extracción adicionales para esos campos. Para ello, debe mapear las columnas del catálogo de datos a los campos correspondientes en la skill. Una actividad Classify By Company utiliza catálogos de datos del tipo Document Issuer Companies, disponibles en el servidor de Vantage al que está conectado. En algunos casos, es posible que quiera buscar en el documento un par de empresas relacionadas (por ejemplo, un proveedor y un comprador de mercancías). Para ello, agregue un segundo catálogo de datos opcional del tipo Document Receiver Companies. Si necesita encontrar dos empresas no relacionadas, puede usar esta opción o agregar dos actividades Classify By Company.

Búsqueda de un par de empresas

Cada una de las unidades de negocio de su empresa puede tener su propia base de datos de proveedores. Si un proveedor trabaja con varias unidades de negocio, tendrá varias entradas con distintos ID. En este caso, deberá encontrar la entrada exacta del proveedor que corresponda a la unidad de negocio. Para lograrlo, complete la columna Company Correlation ID en el catálogo de datos Document Issuer Companies. La búsqueda entonces buscará pares de empresas en los que el ID de correlación del emisor del documento coincida con el ID del receptor del documento. Si faltan algunos ID de correlación, los pares con ID de correlación coincidentes tendrán prioridad. Al buscar pares de empresas, se generan hipótesis usando la correlación entre un proveedor y una unidad de negocio. La actividad Classify By Company selecciona cinco registros de empresas receptoras de documentos que mejor coinciden de forma fiable con los valores de los campos en la imagen del documento. Luego, para cada registro, la actividad selecciona cinco registros de empresas emisoras de documentos en los que el Company Correlation ID sea idéntico al Receiver Company ID. Si el catálogo de datos no contiene registros en los que el Company Correlation ID sea idéntico al Receiver Company ID, se seleccionan en su lugar los registros con Company Correlation ID vacío.
Importante: Para encontrar pares válidos, debe completar los Company Correlation ID correctos para todos los registros.
Como resultado, se selecciona el par emisor–receptor con la mejor coincidencia. Para obtener más información sobre la detección de empresas, consulte Cómo funciona la detección de empresas. Si las empresas emisoras de sus documentos pueden trabajar con cualquiera de los receptores de documentos, no necesita completar la columna Company Correlation ID en su catálogo de datos Document Issuer Companies, y la búsqueda considerará todos los posibles pares de empresas.

Tipos de catálogos de datos

Catálogo de datos de empresas emisoras del documento

NombreDescripción
ID de la empresa emisoraObtenido mediante la detección del emisor del documento. Identifica al emisor del documento en un sistema de información externo.

Nota: Este es el identificador único del registro en el catálogo de datos si todas las unidades de negocio de la empresa usan la misma base de datos de clientes. De lo contrario, el registro en el catálogo de datos se identifica de forma única mediante una combinación de ID de la empresa emisora e ID de correlación de la empresa.
ID de correlación de la empresaIdentificador de la unidad de negocio de la empresa.

Nota: Si las unidades de negocio de la empresa usan diferentes bases de datos de clientes, esta columna del catálogo de datos debe completarse, ya que la clave única del registro en el catálogo de datos será una combinación de ID de la empresa emisora e ID de correlación de la empresa. Para más información, consulta Búsqueda de un par de empresas.
ID tributariaEstas columnas pueden utilizarse en una búsqueda por identificador único de la empresa.
ID tributaria nacionalEstas columnas pueden utilizarse en una búsqueda por identificador único de la empresa.
IBANEstas columnas pueden utilizarse en una búsqueda por identificador único de la empresa.
NombreEstas columnas pueden utilizarse en una búsqueda por nombre y dirección de la empresa.
Código postalEstas columnas pueden utilizarse en una búsqueda por nombre y dirección de la empresa.
CalleEstas columnas pueden utilizarse en una búsqueda por nombre y dirección de la empresa.
CiudadEstas columnas pueden utilizarse en una búsqueda por nombre y dirección de la empresa.
Estado o provinciaEstas columnas no se utilizan en el proceso de detección de empresas. Solo pueden usarse para completar los campos del documento.
PaísEstas columnas no se utilizan en el proceso de detección de empresas. Solo pueden usarse para completar los campos del documento.
Cuenta bancariaEstas columnas no se utilizan en el proceso de detección de empresas. Solo pueden usarse para completar los campos del documento.
Código bancarioEstas columnas no se utilizan en el proceso de detección de empresas. Solo pueden usarse para completar los campos del documento.

El catálogo de datos de empresas receptoras de Document

NameDescription
Receiver Company IDObtenido al detectar la empresa receptora del documento. Identifica a la empresa receptora en un sistema de información externo. Clave única del registro en el catálogo de datos.
Tax IDEsta columna se puede usar para la búsqueda de un identificador único de empresa.
NameEstas columnas se pueden usar para la búsqueda por nombre y dirección de la empresa.
Postal CodeEstas columnas se pueden usar para la búsqueda por nombre y dirección de la empresa.
StreetEstas columnas se pueden usar para la búsqueda por nombre y dirección de la empresa.
CityEstas columnas se pueden usar para la búsqueda por nombre y dirección de la empresa.
State or ProvinceEstas columnas no se usan en el proceso de detección de empresas. Solo se pueden usar para completar los campos del documento.
CountryEstas columnas no se usan en el proceso de detección de empresas. Solo se pueden usar para completar los campos del documento.