Saltar al contenido principal
El nivel de detalle y la calidad de los registros del catálogo de datos influyen significativamente en la precisión de la detección de empresas. Cuanto más coincidan los registros del emisor y del receptor del documento con el texto extraído de la imagen del documento, con mayor precisión se identificarán las empresas emisora y receptora.

Mejores prácticas para una detección precisa

Para garantizar que los resultados de la detección sean lo más precisos posible, asegúrese de lo siguiente:
  • Se completen los identificadores únicos de la empresa. Completar las columnas de valores únicos (ID tributaria, ID tributaria nacional, IBAN) mejorará significativamente la probabilidad de una detección correcta, ya que estos valores son únicos para todas las empresas.
  • No existan registros duplicados de empresas. La ausencia de registros duplicados aumentará la probabilidad de detectar correctamente la empresa.
  • No existan registros no relacionados. Los registros obsoletos o inválidos en el catálogo de datos pueden provocar que la empresa se detecte incorrectamente debido a similitudes fortuitas entre distintos valores de campo.
  • Todos los campos estén completos para cada registro de empresa. Especifique la mayor cantidad posible de información precisa sobre las empresas. Cuanto más precisa sea la información, mayor será la probabilidad de detectar correctamente las empresas.

Proceso de detección de empresas

La detección de empresas comprende los siguientes pasos: Los valores de los siguientes campos se consideran identificadores únicos de la empresa:
  • ID tributaria
  • ID tributaria nacional
  • IBAN
Una actividad Classify By Company busca en la imagen del documento los valores de los campos indicados anteriormente mediante palabras clave y expresiones regulares. Si no se especifica ninguna, se omite este paso. Los valores de ID tributaria, ID tributaria nacional e IBAN detectados en una imagen del documento se utilizan para consultar el catálogo de datos. A continuación, los valores de ID tributaria, ID tributaria nacional e IBAN recibidos del catálogo de datos se comparan con los valores detectados en la imagen (se utiliza coincidencia exacta). Para fines de coincidencia, los valores se normalizan de la siguiente manera:
  • las letras se convierten a mayúsculas
  • se eliminan los espacios y los siguientes caracteres: ”.”, ”,”, ””, ”/”, ”****“
Todo el texto detectado en la imagen del documento se utiliza para consultar el catálogo de datos. Luego, los valores de Nombre, Calle, Código postal y Ciudad recibidos del catálogo de datos se comparan con los valores detectados en la imagen (se utiliza coincidencia exacta).
Nota: Para obtener los mejores resultados de búsqueda, asegúrese de que las columnas correspondientes del catálogo de datos estén cumplimentadas. La información del nombre y la dirección de la empresa es especialmente importante cuando no es posible identificar a la empresa mediante una ID tributaria, una ID tributaria nacional o un IBAN.

Paso 3: Generación de hipótesis

A partir de las empresas encontradas en los pasos 1 y 2, se genera un conjunto de hipótesis. La actividad Classify By Company evalúa estas hipótesis y selecciona cinco registros de empresa emisora de documentos y cinco registros de empresa receptora de documentos que coinciden de manera más fiable con los valores de campo detectados en la imagen del documento. Estos registros se utilizan para formar 25 pares, tratando cada par como una hipótesis independiente. Luego, un modelo entrenado puntúa las hipótesis por fiabilidad y selecciona el par emisor–receptor que mejor coincide.
Nota: Incluso si el número de empresas receptoras de documentos es muy pequeño (por ejemplo, si solo hay una empresa receptora de documentos), sigue siendo recomendable usar un catálogo de datos Document Receiver Companies, ya que evitará que una empresa receptora de documentos se detecte incorrectamente como una empresa emisora de documentos.
Si el catálogo de datos Document Issuer Companies especifica que el Issuer Company ID depende del Receiver Company ID, las hipótesis se generan en función de esta correlación (consulte Looking for a pair of companies).

Resultados de la detección de las empresas emisora y receptora del documento

Como resultado de detectar las empresas emisora y receptora en un documento, se encontrarán los siguientes identificadores:
  • El identificador de la empresa emisora en el catálogo de datos Document Issuer Companies
  • El identificador de la empresa receptora en el catálogo de datos Document Receiver Companies
Nota: Si en el catálogo de datos Document Issuer Companies se especifica que el ID de la empresa emisora depende del ID de la empresa receptora (consulte Looking for a pair of companies), el resultado de la detección de la empresa emisora del documento incluirá el ID de la empresa emisora que corresponda al ID de la empresa receptora.