Saltar al contenido principal
En este artículo se describen los distintos tipos de normalización que pueden usarse al agregar columnas de una base de datos externa a un conjunto de datos en una Definición de Document de FCFORINVOICES, así como la configuración de cada uno de estos tipos de normalización. La normalización puede utilizarse para cambiar el formato de valores que se escriben de forma diferente, pero que esencialmente significan lo mismo. La normalización garantiza un formato uniforme de los valores para que puedan compararse. Por ejemplo, la dirección y el nombre de una empresa pueden escribirse de muchas formas distintas. Como estos valores se refieren a la misma empresa y a la misma dirección, deben normalizarse para que el programa pueda realizar una comparación correcta. El tipo de normalización puede especificarse para cada columna de un conjunto de datos al asignar estas columnas a columnas de una base de datos externa. La normalización solo se aplica a los valores almacenados en el conjunto de datos (la opción Cache data debe estar habilitada en las propiedades del conjunto de datos). Los valores de la base de datos externa no se modificarán.
FCFORINVOICES ofrece dos tipos de normalización para los valores del conjunto de datos.

1. Texto

Este tipo de normalización es útil para comparar cadenas como nombres de empresas y direcciones.
  1. Los espacios en blanco (incluidos los caracteres de nueva línea y tabulación) y los símbolos separadores se sustituyen por espacios normales.
  2. Los puntos usados como separadores (es decir, los que aparecen entre palabras) se sustituyen por espacios, y se eliminan los puntos de las abreviaturas.
  3. Normalización de símbolos de conjunción (&, +, -, /, ~):
    • Los conjuntos de palabras que comienzan con una palabra de una sola letra y están separados por el mismo símbolo de conjunción se unen en una sola palabra; por ejemplo, R & D pasa a ser R&D;
    • En todos los demás casos, los símbolos de conjunción se sustituyen por espacios; por ejemplo, Procter&Gamble pasa a ser Procter Gamble.
  4. Se eliminan los espacios dobles.
  5. Se utiliza una lista predefinida para dividir palabras. Por ejemplo, CoKG se divide en Co KG.
  6. Los espacios del texto reconocido se utilizan para dividirlo en palabras independientes.
  7. Se utiliza una lista predefinida para reemplazar los sufijos de cada palabra. Por ejemplo, puede reemplazar el sufijo strasse por el sufijo str.
  8. Reemplazo automático de cadenas de palabras según una lista predefinida. Por ejemplo, puede reemplazar la palabra Limited por la abreviatura Ltd.
Los parámetros de normalización se especifican en el archivo Normalization.xml, que se almacena en la carpeta del proyecto.
El archivo Normalization.xml se puede modificar después de crear el Dataset (por separado para cada Dataset). Para modificar la configuración de normalización predeterminada, haga lo siguiente:
  1. Descargue el archivo de configuración con el comando DownloadNormalizationSettings de FCAdminTools.
  2. Realice los cambios necesarios.
  3. Cargue el archivo de configuración con el comando UpdateNormalizationSettings de FCAdminTools.
¡Importante! Después de actualizar el archivo de configuración, debe actualizar el conjunto de datos. Para obtener más información, consulte Updating data sets.
En futuras versiones del programa pueden introducirse cambios importantes en el algoritmo de normalización.

2. Código alfanumérico

Este tipo de normalización es útil para comparar códigos alfanuméricos, como números de ID tributaria, cuentas bancarias y códigos postales. De los valores se eliminan todos los símbolos excepto los números y las letras, lo que permite compararlos ignorando espacios, guiones, barras y otros caracteres arbitrarios que puedan contener. Cuando se aplica la normalización, la opción Store normalized value pasa a estar disponible al asignar la columna del conjunto de datos a una columna de una base de datos externa.
  • Cuando esta opción está habilitada, los valores normalizados se almacenarán en el conjunto de datos.
  • Cuando esta opción está deshabilitada, los valores originales de la base de datos externa se copiarán en el conjunto de datos.
Esta opción no afecta a la extracción de datos ni a las comprobaciones automáticas, pero sí determina qué valor se mostrará al usuario cuando busque una entrada en un diccionario.