¿Cómo funciona la normalización durante la extracción de datos en el programa?
¿Cómo funciona la normalización durante la extracción de datos en el programa?
FCFORINVOICES ofrece dos tipos de normalización para los valores del conjunto de datos.
1. Texto
- Los espacios en blanco (incluidos los caracteres de nueva línea y tabulación) y los símbolos separadores se sustituyen por espacios normales.
- Los puntos usados como separadores (es decir, los que aparecen entre palabras) se sustituyen por espacios, y se eliminan los puntos de las abreviaturas.
- Normalización de símbolos de conjunción (&, +, -, /, ~):
- Los conjuntos de palabras que comienzan con una palabra de una sola letra y están separados por el mismo símbolo de conjunción se unen en una sola palabra; por ejemplo, R & D pasa a ser R&D;
- En todos los demás casos, los símbolos de conjunción se sustituyen por espacios; por ejemplo, Procter&Gamble pasa a ser Procter Gamble.
- Se eliminan los espacios dobles.
- Se utiliza una lista predefinida para dividir palabras. Por ejemplo, CoKG se divide en Co KG.
- Los espacios del texto reconocido se utilizan para dividirlo en palabras independientes.
- Se utiliza una lista predefinida para reemplazar los sufijos de cada palabra. Por ejemplo, puede reemplazar el sufijo strasse por el sufijo str.
- Reemplazo automático de cadenas de palabras según una lista predefinida. Por ejemplo, puede reemplazar la palabra Limited por la abreviatura Ltd.
Más...
Más...
El archivo Normalization.xml se puede modificar después de crear el Dataset (por separado para cada Dataset). Para modificar la configuración de normalización predeterminada, haga lo siguiente:
- Descargue el archivo de configuración con el comando DownloadNormalizationSettings de FCAdminTools.
- Realice los cambios necesarios.
- Cargue el archivo de configuración con el comando UpdateNormalizationSettings de FCAdminTools.
En futuras versiones del programa pueden introducirse cambios importantes en el algoritmo de normalización.
2. Código alfanumérico
- Cuando esta opción está habilitada, los valores normalizados se almacenarán en el conjunto de datos.
- Cuando esta opción está deshabilitada, los valores originales de la base de datos externa se copiarán en el conjunto de datos.
